ES2205238T3 - Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. - Google Patents

Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio.

Info

Publication number
ES2205238T3
ES2205238T3 ES97928529T ES97928529T ES2205238T3 ES 2205238 T3 ES2205238 T3 ES 2205238T3 ES 97928529 T ES97928529 T ES 97928529T ES 97928529 T ES97928529 T ES 97928529T ES 2205238 T3 ES2205238 T3 ES 2205238T3
Authority
ES
Spain
Prior art keywords
quantification
unit
vector
quantifier
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES97928529T
Other languages
English (en)
Inventor
Takeshi Norimatsu
Shuji Miyasaka
Yoshihisa Makato
Mineo Tsushima
Tomokazu Ishikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Application granted granted Critical
Publication of ES2205238T3 publication Critical patent/ES2205238T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PARA CODIFICAR UNA SEÑAL AUDIO, CON EL USO DE UN PROCEDIMIENTO DE CUANTIFICACION DE VECTORES, DISMINUYENDOSE ASI LA CANTIDAD DE DATOS, LA CODIFICACION LA REALIZA UNA UNIDAD CODIFICADORA (1). CUANDO SE REALIZA ESTA OPERACION, SE SELECCIONA UN CODIGO AUDIO QUE TIENE UNA DISTANCIA MINIMA ENTRE LAS DISTANCIAS AUDITIVAS ENTRE SUBVECTORES PRODUCIDO POR DIVISION DE UN VECTOR DE ENTRADA Y CODIGOS AUDIO EN UN LIBRO DE CODIGO DEL LADO DE TRANSMISION 29003. UNA PARTE CORRESPONDIENTE A UN ELEMENTO DE UN SUBVECTOR QUE TIENE UNA ELEVADA IMPORTANCIA AUDITIVA SE MANIPULA EN UNA UNIDAD DE SELECCION DE CODIGO AUDIO 2900102 MIENTRAS QUE NO TIENEN EN CUENTA LOS CODIGOS POSITIVOS Y NEGATIVOS QUE INDICAN SU INFORMACION EN CUANTO A FASE, Y SOMETIDOS A RECUPERACION COMPARATIVA CON RELACION A LOS CODIGOS AUDIO EN UN LIBRO DE CODIGO DEL LADO DE TRANSMISION 29003, Y LA INFORMACION SOBRE FASE CORRESPONDIENTE A UNA PARTE DEL ELEMENTO DEL SUBVECTOR, EXTRAIDA SEPARADAMENTE EN UNA UNIDAD DE EXTRACCION DE INFORMACION SOBREFASE 2900107, SE AÑADE AL RESULTADO OBTENIDO, SIENDO EL RESULTADO LA SALIDA EN FORMA DE INDICE DE CODIGO. DE ESE MODO, DISMINUYEN LA CANTIDAD DE CALCULOS EN LA RECUPERACION POR CODIGO DE LA CUANTIFICACION DE VECTORES Y EL NUMERO DE CODIGOS EN EL LIBRO DE CODIGOS, SIN QUE DISMINUYA POR ELLO LA CALIDAD DE UNA SEÑAL AUDIO, EN EL ASPECTO AUDITIVO, DURANTE LA OPERACION DE DECODIFICACION.

Description

Procedimiento de codificación y decodificación de señales de audio, y codificador y decodificador de señales de audio.
Campo técnico
La presente invención se refiere a aparatos y procedimientos de codificación, en los que una cantidad de una característica, obtenida de una señal de audio, tal como una señal de voz o una señal musical y, en especial, una señal obtenida transformando una señal de audio del dominio del tiempo en una señal de audio del dominio de la frecuencia, utilizando un procedimiento como el de la transformada ortogonal, se codifica con eficacia de tal forma que se expresa con menos cadenas codificadas que la señal de audio original, así como a aparatos y procedimientos de decodificación que tienen una estructura capaz de decodificar una señal de audio de banda ancha y gran calidad, utilizando todos o sólo una parte de los cadenas codificadas que son señales codificadas.
Antecedentes de la técnica
Se han propuesto diversos procedimientos para codificar y decodificar con eficacia las señales de audio. En particular, en los últimos años, se ha propuesto el procedimiento de audio MPEG para las señales de audio que tienen una banda de frecuencias que sobrepasa los 20 kHz (por ejemplo, una señal musical). En el procedimiento de codificación representado por el procedimiento MPEG, una señal de audio del eje del tiempo se transforma en datos del eje de la frecuencia, mediante una transformada ortogonal (por ejemplo, una transformada de coseno) y, en el eje de la frecuencia, se codifican los datos que tienen importancia auditiva, mediante la característica de sensibilidad auditiva de los seres humanos, mientras que los datos sin importancia auditiva y los datos redundantes no se codifican. Para expresar una señal de audio con una cantidad de datos considerablemente inferior a la cantidad de datos de la señal digital original, existe un procedimiento de codificación que utiliza un método de cuantificación vectorial como el TC-WVQ. Los procedimientos de audio MPEG y TC-WVQ se describen en el estándar ISO/IEC IS-11172-3 y en el documento de T. Moriya y H. Suga: "An 8 Kbits transform coder for noisy channels", Proc. ICASSP 89, pp. 196-199, respectivamente. De ahora en adelante, la estructura del aparato de codificación de audio convencional se describirá en relación con la Figura 37. En la Figura 37, el número de referencia 1601 designa una unidad FFT que transforma la frecuencia de una señal de entrada, 1602 designa una unidad de cálculo de asignación de bits adaptativa que codifica una banda concreta de la señal de entrada con transformación de frecuencia, 1603 designa una unidad de división de subbandas que divide la señal de entrada en una pluralidad de bandas, 1604 designa una unidad de normalización de factor de escala que normaliza los componentes de la pluralidad de bandas y 1605 designa una unidad de cuantificación escalar.
A continuación, se describe el funcionamiento. La señal de entrada entra en la unidad FFT 1601 y en la unidad de división de subbandas 1603. En la unidad FFT 1601, la señal de entrada se somete a transformación de frecuencia y entra en la unidad de asignación de bits adaptativa 1602. En la unidad de asignación de bits adaptativa 1602, se calcula qué cantidad de datos debe darse a un componente de banda concreto, basándose en el límite audible mínimo (definido de conformidad con la característica auditiva de los seres humanos) y la característica de enmascaramiento, y la asignación de las cantidades de datos a cada una de las bandas se codifica como un índice.
Por otra parte, en la unidad de división de subbandas 1603, la señal de entrada se divide en 32 bandas, por ejemplo. En la unidad de normalización de factor de escala 1604, la normalización para cada componente de banda obtenido en la unidad de división de subbandas 1603 se lleva a cabo con un valor representativo. El valor normalizado se cuantifica como un índice. En la unidad de cuantificación escalar 1605, basándose en la asignación de bits calculada por la unidad de cálculo de asignación de bits adaptativa 1602, la salida de la unidad de normalización del factor de escala 1604 se somete a cuantificación escalar y el valor cuantificado se codifica como un índice.
Mientras tanto, se han propuesto diversos procedimientos para codificar con eficacia una señal acústica. En particular, en los últimos años, se codifican señales que tienen una banda de frecuencias de alrededor de 20 kHz (por ejemplo, señales musicales), mediante el procedimiento de audio MPEG u otro similar. En los procedimientos representados por el procedimiento MPEG, una señal de audio digital del eje del tiempo se transforma en una señal del eje de la frecuencia mediante una transformada ortogonal, y se dan cantidades de datos a los datos del eje de la frecuencia (dándose prioridad al que tiene importancia auditiva) teniendo en cuenta la característica de sensibilidad auditiva de los seres humanos. Para expresar una señal que tiene una cantidad de datos considerablemente inferior a la cantidad de datos de la señal digital original, se emplea un procedimiento de codificación que utiliza un método de cuantificación vectorial, como, por ejemplo, el TCWVQ (Codificación de transformada para cuantificación vectorial ponderada). El procedimiento de audio MPEG y TCWVQ se describen en el estándar ISO/IEC IS-11172-3 y en el documento de T. Moriya y H. Suga: "An 8 Kbits transform coder for noisy channels", Proc. ICASSP 89, pp. 196-199, respectivamente.
En el aparato de codificación de señales de audio convencional construido del modo descrito anteriormente, se utiliza de forma generalizada el procedimiento de audio MPEG, de tal forma que la codificación se lleva a cabo con una cantidad de datos de 64000 bits/s para cada canal. Con una cantidad de datos inferior a ésta, el ancho de banda de frecuencias reproducible y la calidad subjetiva de la señal de audio decodificada a veces se degradan considerablemente, debido al motivo descrito a continuación. Como en el ejemplo mostrado en la Figura 37, los datos codificados se dividen grosso modo en tres partes principales: asignación de bits, valor representativo de banda y valor cuantificado. Entonces, cuando la relación de compresión es alta, no se asigna una cantidad de datos suficiente al valor cuantificado. Además, en el aparato de codificación de señales de audio convencional, por lo general, el codificador y el decodificador se construyen con cantidades iguales de datos para codificar y datos para decodificar. Por ejemplo, en un procedimiento en el que se codifica una cantidad de datos de 128000 bits/s, se decodifica una cantidad de datos de 128000 bits en el decodificador.
No obstante, en los aparatos de codificación y decodificación de señales de audio convencionales, la codificación y la decodificación debe llevarse a cabo con una cantidad de datos fija para obtener sonido de buena calidad y, por consiguiente, es imposible obtener sonido de alta calidad con una relación de compresión alta.
Grant Davidson y Allen Gersho dan a conocer, en el artículo "Multiple-stage vector excitation coding of speech waveforms", publicado en 1988 IEEE, p. 163 y ss., procedimientos de codificación de formas de onda de voz. Según esta propuesta, la voz se representa aplicando una secuencia de vectores de excitación a un filtro de generación de voz LPC variable en el tiempo, en la que cada vector se selecciona a partir de un libro de códigos utilizando una medida de rendimiento basada en la percepción. La propuesta consiste en calcular de forma consecutiva el vector de voz de entrada en varias etapas VQ dispuestas en cascada, siendo el vector de entrada de cada etapa el vector de error de cuantificación de la etapa anterior.
La presente invención pretende resolver los problemas mencionados anteriormente y tiene como objetivo proporcionar aparatos de codificación y decodificación de señales de audio, y procedimientos de codificación y decodificación de señales de audio, en los que se obtiene una alta calidad y una amplia banda de frecuencias de reproducción, aun cuando la codificación y la decodificación se lleven a cabo con una cantidad de datos pequeña, y en los que, además, la cantidad de datos en la codificación y la decodificación puede ser variable, es decir, no fija.
Asimismo, en los aparatos de codificación de señales de audio convencionales, la cuantificación se lleva a cabo generando un índice de código correspondiente a un código que proporciona una distancia auditiva mínima entre cada código contenido en un bloque de códigos y un vector de característica de audio. No obstante, cuando el número de códigos contenidos en el libro de códigos es grande, la cantidad de cálculos para recuperar un código óptimo aumenta de forma significativa. Además, cuando la cantidad de datos contenida en el libro de códigos es grande, se requiere una gran cantidad de memoria para la construcción del aparato de codificación mediante hardware, lo que resulta poco rentable. Asimismo, en la parte de recepción, se requiere una recuperación y una cantidad de memoria correspondiente a los índices de código.
La presente invención pretende resolver los problemas mencionados anteriormente y tiene como objetivo proporcionar un aparato de codificación de señales de audio que reduzca el número de recuperaciones de códigos y que cuantifique con eficacia las señales de audio con un libro de códigos que tenga un número de códigos inferior, y un aparato de decodificación de señales de audio que pueda decodificar las señales de audio.
Exposición de la invención
Un procedimiento de codificación de señales de audio según la presente invención (reivindicación 1) es un procedimiento para codificar una cantidad de datos mediante cuantificación vectorial, utilizando un método de cuantificación de varias etapas que comprende un primer método de cuantificación vectorial para efectuar la cuantificación vectorial de una secuencia de señales de característica de frecuencia que se obtiene mediante la transformación de la frecuencia de la señal de audio de entrada, y un segundo método de cuantificación vectorial para efectuar la cuantificación vectorial del componente de error de cuantificación del primer método de cuantificación vectorial; en el que, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, se selecciona uno de los bloques de frecuencias del componente de error de cuantificación del primer método de cuantificación vectorial que tiene gran importancia para la cuantificación y, en el segundo método de cuantificación vectorial, se cuantifica el componente de error de cuantificación del primer método de cuantificación respecto del bloque de frecuencias seleccionado.
Un procedimiento de codificación de señales de audio según la presente invención (reivindicación 2) es un procedimiento para codificar una cantidad de datos mediante cuantificación vectorial, utilizando un método de cuantificación de varias etapas que comprende un método de cuantificación vectorial de primera etapa para efectuar la cuantificación vectorial de una secuencia de señales característica de frecuencia que se obtiene mediante la transformación de la frecuencia de la señal de audio de entrada, y métodos de cuantificación vectorial de segunda etapa y siguientes para efectuar la cuantificación vectorial del componente de error de cuantificación del método de cuantificación vectorial de la etapa anterior; en el que, entre las diversas etapas de los métodos de cuantificación según el método de cuantificación de varias etapas, por lo menos un método de cuantificación vectorial lleva a cabo la cuantificación vectorial utilizando, como coeficientes de ponderación para la cuantificación, coeficientes de ponderación en frecuencia calculados basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos; y basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, se selecciona uno de los bloques de frecuencias del componente de error del método de cuantificación vectorial de la primera etapa que tiene gran importancia para la cuantificación y, en el método de cuantificación vectorial de la segunda etapa, se cuantifica el componente de error de cuantificación del método de cuantificación de la primera etapa con respecto al bloque de frecuencias seleccionado.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 3) comprende: una unidad de transformación tiempo-frecuencia para transformar una señal de audio de entrada en una señal del dominio de la frecuencia; una unidad de cálculo de envolvente espectral para calcular la envolvente espectral de la señal de audio de entrada; una unidad de normalización para normalizar la señal del dominio de la frecuencia obtenida en la unidad de transformación tiempo-frecuencia con la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y obtener, de ese modo, una señal residual; una unidad de cálculo de ponderación auditiva para calcular coeficientes de ponderación en frecuencia, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos; y una unidad de cuantificación de varias etapas que tiene diversas etapas de unidades de cuantificación vectorial conectadas en columnas, que recibe la señal residual normalizada y en la que por lo menos una de las unidades de cuantificación vectorial lleva a cabo la cuantificación utilizando los coeficientes de ponderación obtenidos en la unidad de ponderación.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 4) es un aparato de codificación de señales de audio según la reivindicación 3, en el que una pluralidad de unidades de cuantificación de las diversas etapas de la unidad de cuantificación de varias etapas lleva a cabo la cuantificación utilizando los coeficientes de ponderación obtenidos en la unidad de ponderación, y dicha unidad de cálculo de ponderación auditiva calcula los coeficientes de ponderación individuales que van a ser utilizados en las diversas etapas de las unidades de cuantificación, respectivamente.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 5) es un aparato de codificación de señales de audio según la reivindicación 4 en el que dicha unidad de cuantificación de varias etapas comprende: una unidad de cuantificación de primera etapa para cuantificar la señal residual normalizada por la unidad de normalización, utilizando la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral como coeficientes de ponderación en los respectivos dominios de frecuencia; una unidad de cuantificación de segunda etapa para cuantificar una señal de error de cuantificación de la unidad de cuantificación de primera etapa, utilizando los coeficientes de ponderación calculados basándose en la correlación entre la envolvente espectral y la señal de error de cuantificación de la unidad de cuantificación de la primera etapa, como coeficientes de ponderación en los respectivos dominios de frecuencia y una unidad de cuantificación de la tercera etapa para cuantificar una señal de error de cuantificación de la unidad de cuantificación de segunda etapa, utilizando como coeficientes de ponderación en los respectivos dominios de frecuencia los coeficientes de ponderación obtenidos ajustando los coeficientes de ponderación calculados por la unidad de cálculo de ponderación auditiva, según la señal de entrada transformada en una señal del dominio de la frecuencia por la unidad de transformación tiempo-frecuencia y la característica auditiva, basándose en la envolvente espectral, la señal de error de cuantificación de la unidad de cuantificación de segunda etapa y la señal residual normalizada por la unidad de normalización.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 6) comprende una unidad de transformación tiempo-frecuencia para transformar una señal de audio de entrada en una señal del dominio de la frecuencia; una unidad de cálculo de envolvente espectral para calcular la envolvente espectral de la señal de audio de entrada; una unidad de normalización para normalizar la señal de dominio de la frecuencia obtenida en la unidad de transformación tiempo-frecuencia, con la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral para obtener, de ese modo, una señal residual; un primer cuantificador de vectores para cuantificar la señal residual normalizada por la unidad de normalización; medios de selección auditiva para seleccionar uno de los bloques de frecuencias del componente de error de cuantificación del primer cuantificador de vectores que tiene gran importancia para la cuantificación, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos y un segundo cuantificador para cuantificar el componente de error de cuantificación del primer cuantificador de vectores con respecto al bloque de frecuencias seleccionado por los medios de selección auditiva.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 7) es un aparato de codificación de señales de audio según la reivindicación 6, en el que los medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica de límite audible mínimo.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 8) es un aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica de límite audible mínimo.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 9) es un aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica obtenida sumando la característica de límite audible mínimo y la característica de enmascaramiento calculada a partir de la señal de entrada.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 10) es un aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica obtenida sumando la característica de límite audible mínimo y la característica de enmascaramiento que se calcula a partir de la señal de entrada y se corrige de conformidad con la señal residual normalizada por la unidad de normalización, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la señal de error de cuantificación de la unidad de cuantificación de primera etapa.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 11) es un aparato de codificación de señales de audio para codificar una cantidad de datos mediante cuantificación vectorial, utilizando medios de cuantificación de varias etapas que comprenden un primer cuantificador de vectores para efectuar la cuantificación vectorial de una señal de característica de frecuencia obtenida mediante la transformación de la frecuencia de una señal de audio de entrada, y un segundo cuantificador de vectores para efectuar la cuantificación vectorial del componente de error de cuantificación del primer cuantificador de vectores, en el que dichos medios de cuantificación de varias etapas dividen la secuencia de señales de característica de frecuencia en cadenas de coeficientes correspondientes a por lo menos dos bandas de frecuencias, y cada uno de los cuantificadores de vectores lleva a cabo la cuantificación, de forma independiente, utilizando una pluralidad de cuantificadores de vectores divididos que se preparan adecuadamente para las respectivas cadenas de coeficientes.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 12) es un aparato de codificación de señales de audio según la reivindicación 11, que comprende además medios de normalización para normalizar la secuencia de señales de característica de frecuencia.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 13) es un aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación seleccionan de forma adecuada una de las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar que tiene una suma aditiva de energía elevada del error de cuantificación, y a continuación cuantifican la banda seleccionada.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 14) es un aparato de codificación de señales de audio según la reivindicación 11, en el que los medios de cuantificación seleccionan de forma adecuada una de las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar, basándose en la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, teniendo dicha banda de frecuencias una suma aditiva de energía elevada del error de cuantificación, que se pondera asignando valores altos a las bandas cuya característica de sensibilidad auditiva tiene gran importancia, y a continuación los medios de cuantificación cuantifican la banda seleccionada.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 15) es un aparato de codificación de señales de audio según la reivindicación 11, en el que los medios de cuantificación tienen un cuantificador de vectores que funciona como una unidad de cuantificación de banda completa que cuantifica, por lo menos una vez, todas las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 16) es un aparato de codificación de señales de audio según la reivindicación 11, en el que los medios de cuantificación se construyen de tal forma que el cuantificador de vectores de primera etapa calcula el error de cuantificación de la cuantificación vectorial utilizando un método de cuantificación vectorial con un libro de códigos y, además, el cuantificador de vectores de segunda etapa efectúa la cuantificación vectorial del error de cuantificación calculado.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 17) es un aparato de codificación de señales de audio según la reivindicación 16, en el que, como método de cuantificación vectorial, se utilizan vectores de código (todos o parte de los cuales están invertidos) para la recuperación de códigos.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 18) es un aparato de codificación de señales de audio según la reivindicación 16, que comprende además medios de normalización para normalizar la secuencia de señales de característica de frecuencia, en el que el cálculo de las distancias utilizadas para la recuperación de un código óptimo en la cuantificación vectorial se lleva a cabo calculando las distancias mediante ponderaciones constituidas por los componentes normalizados de la señal de entrada procesados en la unidad de normalización y extrayendo el código que tiene una distancia mínima.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 19) es un aparato de codificación de señales de audio según la reivindicación 18, en el que las distancias se calculan mediante ponderaciones constituidas tanto por los componentes normalizados de la secuencia de señales de característica de frecuencia procesadas por los medios de normalización como por un valor que tiene en cuenta la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, y en el que se extrae el código que tiene la mínima distancia.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 20) es un aparato de codificación de señales de audio según la reivindicación 12, en el que los medios de normalización tienen una unidad de normalización de perfil de frecuencias que normaliza de forma aproximada el perfil de la secuencia de señales de característica de frecuencia.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 21) es un aparato de codificación de señales de audio según la reivindicación 12, en el que dichos medios de normalización tienen una unidad de normalización de amplitud de banda que divide la secuencia de señales de característica de frecuencia en una pluralidad de componentes de bandas unitarias continuas, y normalizan la secuencia de señales dividiendo cada banda unitaria con un solo valor.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 22) es un aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación incluyen un cuantificador de vectores para cuantificar las respectivas cadenas de coeficientes de la secuencia de señales de característica de frecuencia de forma independiente mediante cuantificadores de vectores divididos, e incluyen un cuantificador de vectores que funciona como una unidad de cuantificación de banda completa que cuantifica, por lo menos una vez, todas las bandas de frecuencia de la señal de entrada que se va a cuantificar.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 23) es un aparato de codificación de señales de audio según la reivindicación 22, en el que dichos medios de cuantificación comprenden un primer cuantificador de vectores que comprende un cuantificador de vectores divididos de banda baja, un cuantificador de vectores divididos de banda intermedia y un cuantificador de vectores divididos de banda alta, un segundo cuantificador de vectores conectado después del primer cuantificador, y un tercer cuantificador de vectores conectado después del segundo cuantificador; la secuencia de señales de característica de frecuencia introducida en los medios de cuantificación se divide en tres bandas, y la secuencia de señales de característica de frecuencia del componente de banda baja de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda baja, la secuencia de señales de característica de frecuencia del componente de banda intermedia de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda intermedia y la secuencia de señales de característica de frecuencia del componente de banda alta de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda alta, de forma independiente; el error de cuantificación con respecto a la secuencia de señales de característica de frecuencia se calcula en cada uno de los cuantificadores de vectores divididos que constituyen el primer cuantificador de vectores y el error de cuantificación se introduce en el subsiguiente segundo cuantificador de vectores; el segundo cuantificador de vectores efectúa la cuantificación para el ancho de banda que va a ser cuantificado por el segundo cuantificador de vectores, calcula el error de cuantificación con respecto a la entrada del segundo cuantificador de vectores y lo proporciona al tercer cuantificador de vectores; y el tercer cuantificador de vectores efectúa la cuantificación para el ancho de banda que va a ser cuantificado por el tercer cuantificador de vectores.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 24) es un aparato de codificación de señales de audio según la reivindicación 23, que comprende además una primera unidad de selección de banda de cuantificación entre el primer cuantificador de vectores y el segundo cuantificador de vectores, y una segunda unidad de selección de banda de cuantificación entre el segundo cuantificador de vectores y el tercer cuantificador de vectores; en el que la salida del primer cuantificador de vectores se introduce en la primera unidad de selección de banda de cuantificación, y se selecciona la banda que va a ser cuantificada por el segundo cuantificador de vectores en la primera unidad de selección de banda de cuantificación; el segundo cuantificador de vectores lleva a cabo la cuantificación para el ancho de banda que va a ser cuantificado por el segundo cuantificador de vectores, con respecto a los errores de cuantificación de los tres primeros cuantificadores de error seleccionados por la primera unidad de selección de banda de cuantificación, calcula el error de cuantificación con respecto a la entrada del segundo cuantificador de vectores y lo proporciona a la segunda unidad de selección de banda de cuantificación; la segunda unidad de selección de banda de cuantificación selecciona la banda que va a ser cuantificada por el tercer cuantificador de vectores; y el tercer cuantificador de vectores efectúa la cuantificación para la banda seleccionada por la segunda unidad de selección de banda de cuantificación.
Un aparato de codificación de señales de audio según la presente invención (reivindicación 25) es un aparato de codificación de señales de audio según la reivindicación 23, en el que, en vez del primer cuantificador de vectores, se construye el segundo cuantificador de vectores o el tercer cuantificador de vectores utilizando el cuantificador de vectores divididos de banda baja, el cuantificador de vectores divididos de banda intermedia y el cuantificador de vectores divididos de banda alta.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 26) es un aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio definido en la reivindicación 11, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende: una unidad de cuantificación inversa para efectuar la cuantificación inversa utilizando, por lo menos, una parte de los códigos proporcionados por los medios de cuantificación del aparato de codificación de señales de audio; y una unidad de transformación de frecuencia inversa para transformar una secuencia de señales de característica de frecuencia proporcionada por la unidad de cuantificación inversa en una señal correspondiente a la señal de audio de entrada original.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 27) es un aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 12, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende; una unidad de cuantificación inversa para reproducir una secuencia de señales de característica de frecuencia; una unidad de normalización inversa para reproducir los componentes normalizados basándose en los códigos proporcionados por el aparato de codificación de señales de audio, utilizando la secuencia de señales de característica de frecuencia proporcionada por la unidad de cuantificación inversa y multiplicando la secuencia de señales de característica de frecuencia y los componentes normalizados; y una unidad de transformación de frecuencia inversa para recibir la salida de la unidad de normalización inversa y transformar la secuencia de señales de característica de frecuencia en una señal correspondiente a la señal de audio original.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 28) es un aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 22, decodifica estos códigos para generar una señal correspondiente a la señal de audio original y comprende: una unidad de cuantificación inversa que efectúa la cuantificación inversa utilizando los códigos obtenidos, ya sea de todos los cuantificadores de vectores que constituyen los medios de cuantificación del aparato de codificación de señales de audio o bien de algunos de ellos.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 29) es un aparato de decodificación de señales de audio según la reivindicación 28, en el que la unidad de cuantificación inversa efectúa la cuantificación inversa de los códigos cuantificados en una banda establecida ejecutando, de forma alternada, la cuantificación inversa de los códigos cuantificados en la siguiente etapa y la cuantificación inversa de los códigos cuantificados en una banda diferente de la establecida; cuando no hay ningún código cuantificado en la siguiente etapa durante la cuantificación inversa, la unidad de cuantificación inversa ejecuta de forma continuada la cuantificación inversa de los códigos cuantificados en la banda diferente; y cuando no hay ningún código cuantificado en la banda diferente, la unidad de cuantificación inversa ejecuta de forma continuada la cuantificación inversa de los códigos cuantificados en la siguiente etapa.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 30) es un aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 23, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende una unidad de cuantificación inversa que efectúa la cuantificación inversa utilizando sólo los códigos proporcionados por el cuantificador de vectores divididos de banda baja que forma parte del primer cuantificador de vectores, aun cuando todos o parte de los tres cuantificadores de vectores divididos que constituyen el primer cuantificador de vectores del aparato de codificación de señales de audio generen códigos.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 31) es un aparato de decodificación de señales de audio según la reivindicación 30, en el que la unidad de cuantificación inversa efectúa la cuantificación inversa utilizando códigos proporcionados por el segundo cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja que forma parte del primer cuantificador de vectores.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 32) es un aparato de decodificación de señales de audio según la reivindicación 31, en el que la unidad de cuantificación inversa lleva a cabo la cuantificación inversa utilizando códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, y los códigos proporcionados por el segundo cuantificador de vectores.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 33) es un aparato de decodificación de señales de audio según la reivindicación 32, en el que la unidad de cuantificación inversa lleva a cabo la cuantificación inversa utilizando los códigos proporcionados por el tercer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, los códigos proporcionados por el segundo cuantificador de vectores y los códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores.
Un aparato de decodificación de señales de audio según la presente invención (reivindicación 34) es un aparato de decodificación de señales de audio según la reivindicación 33, en el que la unidad de cuantificación inversa efectúa la cuantificación inversa utilizando códigos proporcionados por el cuantificador de vectores divididos de banda alta, que forma parte del primer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, los códigos proporcionados por el segundo cuantificador de vectores, los códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores, y los códigos proporcionados por el tercer cuantificador de vectores.
\newpage
Breve descripción de los dibujos
La Figura 1 es un diagrama que ilustra toda la estructura de los aparatos de codificación y decodificación de señales de audio según una primera forma de realización de la presente invención.
La Figura 2 es un diagrama de bloques que ilustra un ejemplo de unidad de normalización, que forma parte del aparato de codificación de señales de audio descrito anteriormente.
La Figura 3 es un diagrama de bloques que ilustra un ejemplo de unidad de normalización de perfil de frecuencias, que forma parte del aparato de codificación de señales de audio descrito anteriormente.
La Figura 4 es un diagrama que ilustra la estructura detallada de una unidad de cuantificación del aparato de codificación.
La Figura 5 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una segunda forma de realización de la presente invención.
La Figura 6 es un diagrama de bloques que ilustra la estructura de un aparato de codificación de señales de audio según una tercera forma de realización de la presente invención.
La Figura 7 es un diagrama de bloques que ilustra las estructuras detalladas de la unidad de cuantificación y la unidad de selección auditiva de cada etapa del aparato de codificación de señales de audio mostrado en la Figura 6.
La Figura 8 es un diagrama que ilustra la operación de cuantificación del cuantificador de vectores.
La Figura 9 es un diagrama que muestra la señal de error zi, la envolvente espectral I1 y la característica de límite audible mínimo hi.
La Figura 10 es un diagrama de bloques que ilustra las estructuras detalladas de otros ejemplos de cada unidad de cuantificación y una unidad de selección auditiva incluidos en el aparato de codificación de señales de audio mostrado en la Figura 6.
La Figura 11 es un diagrama de bloques que ilustra las estructuras detalladas de otros ejemplos de cada unidad de cuantificación y una unidad de selección auditiva incluidos en el aparato de codificación de señales de audio mostrado en la Figura 6.
La Figura 12 es un diagrama de bloques que ilustra las estructuras detalladas de otros ejemplos de cada unidad de cuantificación y una unidad de selección auditiva incluidos en el aparato de codificación de señales de audio mostrado en la Figura 6.
La Figura 13 es un diagrama que ilustra un ejemplo de selección del bloque de frecuencias que tiene la importancia más alta (longitud W).
La Figura 14 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una cuarta forma de realización de la presente invención.
La Figura 15 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una quinta forma de realización de la presente invención.
La Figura 16 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una sexta forma de realización de la presente invención.
La Figura 17 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una séptima forma de realización de la presente invención.
La Figura 18 es un diagrama de bloques que ilustra la estructura del aparato de codificación de señales de audio según una octava forma de realización de la presente invención.
La Figura 19 es un diagrama que ilustra con detalle la operación de cuantificación efectuada en cada unidad de cuantificación incluida en el aparato de codificación 1 según cualquiera de las formas de realización primera a octava.
La Figura 20 es un diagrama que ilustra el aparato de decodificación de señales de audio según una novena forma de realización de la presente invención.
La Figura 21 es un diagrama que ilustra el aparato de decodificación de señales de audio según una décima forma de realización de la presente invención.
\newpage
La Figura 22 es un diagrama que ilustra el aparato de decodificación de señales de audio según una decimoprimera forma de realización de la presente invención.
La Figura 23 es un diagrama que ilustra el aparato de decodificación de señales de audio según una decimosegunda forma de realización de la presente invención.
La Figura 24 es un diagrama que ilustra el aparato de decodificación de señales de audio según una decimotercera forma de realización de la presente invención.
La Figura 25 es un diagrama que ilustra el aparato de decodificación de señales de audio según una decimocuarta forma de realización de la presente invención.
La Figura 26 es un diagrama que ilustra el funcionamiento detallado de la unidad de cuantificación inversa que forma parte del aparato de decodificación de señales de audio.
La Figura 27 es un diagrama que ilustra el funcionamiento detallado de la unidad de normalización inversa, que forma parte del aparato de decodificación de señales de audio.
La Figura 28 es un diagrama que ilustra el funcionamiento detallado de la unidad de normalización inversa de perfil de frecuencias que forma parte del aparato de decodificación de señales de audio.
Mejores modos de poner en práctica la invención
Forma de realización 1
La Figura 1 es un diagrama que ilustra toda la estructura de los aparatos de codificación y decodificación de señales de audio según una primera forma de realización de la presente invención. En la Figura 1, el número de referencia 1 designa el aparato de codificación y el 2 designa el aparato de decodificación. En el aparato de codificación 1, el número de referencia 101 designa una unidad de división de tramas que divide la señal de entrada en un número establecido de tramas; 102 designa una unidad de multiplicación de ventana que multiplica la señal de entrada y una función de ventana en el eje del tiempo; 103 designa una unidad MDCT que efectúa la transformada discreta del coseno modificada para la conversión tiempo-frecuencia de la señal del eje del tiempo en una señal del eje de la frecuencia; 104 designa una unidad de normalización que recibe tanto la señal del eje del tiempo proporcionada por la unidad de división de tramas 101 como los coeficientes MDCT proporcionados por la unidad MDCT 103, y normaliza los coeficientes MDCT; y 105 designa una unidad de cuantificación que recibe los coeficientes MDCT normalizados y los cuantifica. Aunque en esta forma de realización se emplea la MDCT para la transformación tiempo-frecuencia, también puede emplearse la transformada discreta de Fourier (DFT).
En el aparato de decodificación 2, el número de referencia 106 designa una unidad de cuantificación inversa que recibe la señal proporcionada por el aparato de codificación 1 y la somete a cuantificación inversa; 107 designa una unidad de normalización inversa que somete a normalización inversa la salida de la unidad de cuantificación inversa 106; 108 designa una unidad MDCT inversa que efectúa la transformada discreta del coseno modificada de la salida de la unidad de normalización inversa 107; 109 designa una unidad de multiplicación de ventana y 110 designa una unidad de solapamiento de tramas.
A continuación, se describe el funcionamiento de los aparatos de codificación y decodificación de señales de audio construidos de la forma descrita anteriormente.
Se parte del supuesto de que la señal que entra en el aparato de codificación 1 es una secuencia de señales digitales que es continua temporalmente (por ejemplo, una señal digital obtenida mediante cuantificación de 16 bits a una velocidad de muestreo de 48 kHz). Esta señal de entrada se acumula en la unidad de división de tramas 101 hasta que se alcanza el mismo número establecido y se proporciona cuando el número de muestras acumuladas llega a tener una longitud de trama definida. Aquí, la longitud de trama de la unidad de división de tramas 101 es, por ejemplo, cualquiera de las siguientes cantidades de muestras: 128, 256, 512, 1024, 2048 y 4096. En la unidad de división de tramas 101, también es posible generar la señal con una longitud de trama que varía según la característica de la señal de entrada. Además la unidad de división de tramas 101 se construye para obtener una salida para cada longitud de desplazamiento indicado. Por ejemplo, en el caso en que la longitud de trama es de 4096 muestras, cuando se fija una longitud de desplazamiento igual a la mitad de la longitud de trama, la unidad de división de tramas 101 proporciona las últimas 4096 muestras cada vez que la longitud de trama es de 2048 muestras. En efecto, aun cuando la longitud de trama o la velocidad de muestreo sean variables, es posible tener una estructura en la que la longitud de desplazamiento fijada sea la mitad de la longitud de trama.
La salida de la unidad de división de tramas 101 se introduce en la unidad de multiplicación de ventana 102 y en la unidad de normalización 104. En la unidad de multiplicación de ventana 102, la señal de salida de la unidad de división de tramas 101 se multiplica por una función de ventana en el eje del tiempo y el resultado se proporciona desde la unidad de multiplicación de ventana 102. Esto se muestra, por ejemplo, en la fórmula (1)
1
en la que xi es la salida de la unidad de división de tramas 101, hi es la función de ventana y hxi es la salida de la unidad de multiplicación de ventana 102. Además, i es el sufijo del tiempo. La función de ventana hi mostrada en la fórmula (1) es un ejemplo y, en consecuencia, no está limitada a la mostrada en la fórmula (1). La selección de la función de ventana depende de la característica de la señal de entrada, la longitud de trama de la unidad de división de tramas 101 y las formas de las funciones de ventana de las tramas que se hallan temporalmente antes y después de la trama que se procesa. Por ejemplo, si se supone que la longitud de trama de la unidad de división de tramas 101 es N, como la característica de la señal introducida en la unidad de multiplicación de ventana 102, se calcula la potencia de señal media de las señales introducidas cada vez que se cumple N/4 y, cuando la potencia media varía de forma significativa, el cálculo mostrado en la fórmula (1) se ejecuta con una longitud de trama inferior a N. Además, es deseable seleccionar de forma adecuada la función de ventana según la forma de la función de ventana de la trama anterior y la forma de la función de ventana de la trama posterior, para que la forma de la función de ventana de la presente trama no quede distorsionada.
A continuación, la salida de la unidad de multiplicación de ventana 102 se introduce en la unidad MDCT 103, en la que se ejecuta la transformada discreta del coseno modificada y se generan coeficientes MDCT. La fórmula (2) representa una fórmula general de la transformada discreta del coseno modificada.
2
Si se supone que los coeficientes MDCT generados por la unidad MDCT 103 se expresan mediante yk en la fórmula (2), la salida de la unidad MDCT 103 muestra la característica de frecuencia, y su linealidad corresponde a un componente de frecuencia inferior cuando la variable k de yk se acerca a 0, mientras que corresponde a un componente de frecuencia superior cuando la variable k se acerca a N/2-1 desde 0. La unidad de normalización 104 recibe la señal del eje del tiempo proporcionada por la unidad de división de tramas 101 y los coeficientes MDCT proporcionados por la unidad MDCT 103, y normaliza los coeficientes MDCT mediante varios parámetros. Normalizar los coeficientes MDCT consiste en suprimir las variaciones de los valores de los coeficientes MDCT. Dichos valores varían considerablemente entre el componente de banda baja y el componente de banda alta. Por ejemplo, cuando el componente de banda baja es considerablemente superior al componente de banda alta, se selecciona un parámetro que tiene un valor alto en el componente de banda baja y un valor bajo en el componente de banda alta, y los coeficientes MDCT se dividen por este parámetro para suprimir sus variaciones. En la unidad de normalización 104, se codifican los índices que expresan los parámetros utilizados para la normalización.
La unidad de cuantificación 105 recibe los coeficientes MDCT normalizados por la unidad de normalización 104 y cuantifica los coeficientes MDCT. La unidad de cuantificación 105 codifica los índices que expresan los parámetros utilizados para la cuantificación.
Por otra parte, en el aparato de decodificación 2, la decodificación se lleva a cabo utilizando los índices de la unidad de normalización 104 del aparato de codificación 1, y los índices de la unidad de cuantificación 105. En la unidad de cuantificación inversa 106, los coeficientes MDCT normalizados se reproducen utilizando los índices de la unidad de cuantificación 105. En la unidad de cuantificación inversa 106, la reproducción de los coeficientes MDCT puede llevarse a cabo utilizando todos o algunos de los índices. Naturalmente, la salida de la unidad de normalización 104 y la salida de la unidad de cuantificación inversa 106 no son siempre idénticas a las salidas anteriores a la cuantificación, debido a la presencia de errores en la cuantificación llevada a cabo por la unidad de cuantificación 105.
En la unidad de normalización inversa 107, los parámetros utilizados para la normalización en el aparato de codificación 1 se restauran a partir de los índices proporcionados por la unidad de normalización 104 del aparato de codificación 1, y la salida de la unidad de cuantificación inversa 106 se multiplica por los parámetros para restaurar los coeficientes MDCT. En la unidad MDCT inversa 108, los coeficientes MDCT proporcionados por la unidad de normalización inversa 107 se someten a MDCT inversa y, de ese modo, la señal del dominio de la frecuencia se restaura como una señal del dominio del tiempo. El cálculo de la MDCT inversa viene representado, por ejemplo, por la fórmula (3)
3
en la que yyk son los coeficientes MDCT restaurados en la unidad de normalización inversa 107, y xx(k) son los coeficientes MDCT inversos que se obtienen de la unidad MDCT inversa 108.
La unidad de multiplicación de ventana 109 lleva a cabo la multiplicación de ventana utilizando la salida xx(k) de la unidad MDCT inversa 108. La multiplicación de ventana se lleva a cabo utilizando la misma ventana utilizada por la unidad de multiplicación de ventana 102 del aparato de codificación B1, y se lleva a cabo el procedimiento mostrado, por ejemplo, en la fórmula (4)
4
en la que zi es la salida de la unidad de multiplicación de ventana 109.
La unidad de solapamiento de tramas 110 reproduce la señal de audio mediante la salida de la unidad de multiplicación de ventana 109. Puesto que la salida de la unidad de multiplicación de ventana 109 es una señal solapada temporalmente, la unidad de solapamiento de tramas 110 proporciona la señal de salida del aparato de decodificación B2 utilizando, por ejemplo, la fórmula (5)
5
en la que zm(i) es la i-ésima señal de salida z(i) de la unidad de multiplicación de ventana 109 de la m-ésima trama de tiempo, zm-1(i) es la i-ésima señal de salida de la unidad de multiplicación de ventana 109 de la (m-1)-ésima trama de tiempo, SHIFT es el número de muestra correspondiente a la longitud del desplazamiento del aparato de codificación y out(i) es la señal de salida del aparato de decodificación 2 de la m-ésima trama de tiempo de la unidad de solapamiento de tramas 110.
A continuación se describirá en detalle un ejemplo de unidad de normalización 104 en relación con la Figura 2. En la Figura 2, el número de referencia 201 designa una unidad de normalización de perfil de frecuencias que recibe las salidas de la unidad de división de tramas 101 y la unidad MDCT 103; y 202 designa una unidad de normalización de amplitud de banda que recibe la salida de la unidad de normalización de perfil de frecuencias 201 y lleva a cabo la normalización con referencia a una tabla de bandas 203.
A continuación, se describe el funcionamiento. La unidad de normalización de perfil de frecuencias 201 calcula un perfil de frecuencias, es decir, una forma aproximada de las frecuencias, mediante los datos del eje del tiempo proporcionados por la unidad de división de tramas 101, y divide por éste los coeficientes MDCT obtenidos de la unidad MDCT 103. Los parámetros utilizados para expresar el perfil de frecuencias se codifican como índices. La unidad de normalización de amplitud de banda 202 recibe la señal de salida de la unidad de normalización de perfil de frecuencias 201, y efectúa la normalización de cada banda mostrada en la tabla de bandas 203. Por ejemplo, suponiendo que los coeficientes MDCT proporcionados por la unidad de normalización de perfil de frecuencias 201 son dct(i) (i = 0 \sim 2047) y la tabla de bandas 203 es, por ejemplo, la Tabla 1 mostrada, se calcula el valor medio de la amplitud de cada banda utilizando, por ejemplo, la fórmula (6).
6
7
en la que bjlow y bjhigh son el índice i de banda más baja y el índice i de banda más alta, respectivamente, entre los cuales se halla el dct(i) de la j-ésima banda mostrada en la tabla de bandas 203. Además, p es la norma en el cálculo de la distancia (que es deseable que sea 2) y avej es la media de la amplitud de cada número de banda j. La unidad de normalización de amplitud de banda 202 cuantifica avej para obtener qavej y normalizarlo utilizando, por ejemplo, la fórmula (7).
8
Para cuantificar avej, puede emplearse cuantificación escalar o cuantificación vectorial mediante el libro de códigos. La unidad de normalización de amplitud de banda 202 codifica los índices de los parámetros utilizados para expresar qavej.
Aunque la unidad de normalización 104 del aparato de codificación 1 se construye utilizando la unidad de normalización de perfil de frecuencias 201 y la unidad de normalización de amplitud de banda 202 como se muestra en la Figura 2, también puede construirse utilizando ya sea la unidad de normalización de perfil de frecuencias 201 ó bien la unidad de normalización de amplitud de banda 202. Además, cuando no hay ninguna variación significativa entre el componente de banda baja y el componente de banda alta de los coeficientes MDCT obtenidos de la unidad MDCT 103, la salida de la unidad MDCT 103 puede introducirse directamente en la unidad de cuantificación 105 sin utilizar las unidades 201 y 202.
A continuación, se describirá en detalle la unidad de normalización de perfil de frecuencias 201 mostrada en la Figura 2, en relación con la Figura 3. En la Figura 3, el número de referencia 301 designa una unidad de análisis de predicción lineal que recibe la salida de la unidad de división de tramas 101 y efectúa el análisis predictivo lineal; 302 designa una unidad de cuantificación de perfil que cuantifica el coeficiente obtenido en la unidad de análisis de predicción lineal 301 y 303 designa una unidad de normalización de característica de envolvente que normaliza los coeficientes MDCT mediante la envolvente espectral.
A continuación, se describirá el funcionamiento de la unidad de normalización de perfil de frecuencias 201. La unidad de análisis de predicción lineal 301 recibe la señal de audio del eje del tiempo desde la unidad de división de tramas 101, lleva a cabo la codificación predictiva lineal (LPC) y calcula los coeficientes de predicción lineal (coeficientes LPC). Los coeficientes de predicción lineal pueden obtenerse, por lo general, calculando una función de autocorrelación de una señal sometida a multiplicación de ventana (por ejemplo, una ventana de Hamming) y resolviendo una ecuación normal o similar. Los coeficientes de predicción lineal calculados de esta forma se convierten en coeficientes de pares espectrales lineales (coeficientes LSP) o similares y se cuantifican en la unidad de cuantificación de perfil 302. Puede emplearse la cuantificación vectorial o la cuantificación escalar como método de cuantificación. A continuación, la característica de transferencia de frecuencia (envolvente espectral) expresada por los parámetros cuantificados por la unidad de cuantificación de perfil 302 se calculan en la unidad de normalización de característica de envolvente 303, y los coeficientes MDCT obtenidos de la unidad MDCT 103 se dividen por la característica que se va a normalizar. Para concretar, cuando los coeficientes de predicción lineal equivalentes a los parámetros cuantificados por la unidad de cuantificación de perfil 302 son qlpc(i), la característica de transferencia de frecuencia calculada por la unidad de normalización de característica de envolvente 303 se obtiene mediante la fórmula (8)
9
en la que es deseable que ORDER sea 10 \sim 40 y fft( ) significa transformada de Fourier de alta velocidad. Mediante la característica de transferencia de frecuencia calculada env(i), la unidad de normalización de característica de envolvente 303 efectúa la normalización utilizando, por ejemplo, la fórmula (9) siguiente
10
en la que mdct(i) es la señal de salida de la unidad MDCT 103 y fdct(i) es la señal de salida normalizada de la unidad de normalización de característica de envolvente 303. El procedimiento de normalización de la cadena de coeficientes MDCT se lleva a cabo en las etapas mencionadas anteriormente.
A continuación, se describirá en detalle la unidad de cuantificación 105 del aparato de codificación 1, en relación con la Figura 4. En la Figura 4, el número de referencia 4005 designa una unidad de cuantificación de varias etapas que lleva a cabo la cuantificación vectorial de la secuencia de señales de característica de frecuencia (cadena de coeficientes MDCT) ajustada mediante la unidad de normalización 104. La unidad de cuantificación de varias etapas 4005 incluye un cuantificador de primera etapa 40051, un cuantificador de segunda etapa 40052, ..., un cuantificador de enésima etapa 40053 que se conectan en columna. Además, 4006 designa una unidad de cálculo de ponderación auditiva que recibe los coeficientes MDCT proporcionados por la unidad MDCT 103 y la envolvente espectral obtenida en la unidad de normalización de característica de envolvente 303, y proporciona un coeficiente de ponderación utilizado para la cuantificación, en la unidad de cuantificación de varias etapas 4005, basada en la característica de sensibilidad auditiva.
La cadena de coeficientes MDCT proporcionada por la unidad MDCT 103 y la envolvente espectral LPC obtenida en la unidad de normalización de característica de envolvente 303 entran en la unidad de cálculo de ponderación auditiva 4006 y, con respecto al espectro de la secuencia de señales de característica de frecuencia proporcionada por la unidad MDCT 103, basándose en la característica de sensibilidad auditiva que es la capacidad auditiva de los seres humanos (por ejemplo, la característica de límite audible mínimo y la característica de enmascaramiento auditivo) se calcula una señal característica relativa a la característica de sensibilidad auditiva y, además, se obtiene un coeficiente de ponderación utilizado para la cuantificación, basándose en la señal de característica y la envolvente espectral.
Los coeficientes MDCT normalizados proporcionados por la unidad de normalización 104 se cuantifican en el cuantificador de la primera etapa 40051 de la unidad de cuantificación de varias etapas 4005, utilizando el coeficiente de ponderación obtenido por la unidad de cálculo de ponderación auditiva 4006, y el componente de error de cuantificación ocasionado por la cuantificación en el cuantificador de primera etapa 40051 se cuantifica en el cuantificador de segunda etapa 40052 de la unidad de cuantificación de varias etapas 4005, utilizando el coeficiente de ponderación obtenido por la unidad de cálculo de ponderación auditiva 4006. A continuación, de la misma forma mencionada anteriormente, se cuantifica. en cada etapa de la unidad de cuantificación de varias etapas, un componente de error de cuantificación ocasionado por la cuantificación en el cuantificador de la etapa anterior. La codificación de la señal de audio finaliza una vez que el componente de error de cuantificación ocasionado por la cuantificación en el cuantificador de (N-1)-ésima etapa ha sido cuantificado en el cuantificador de N-ésima etapa 40053, utilizando el coeficiente de ponderación obtenido por la unidad de cálculo de ponderación auditiva 4006.
Como se ha descrito anteriormente, según el aparato de codificación de señales de audio de la primera forma de realización, la cuantificación vectorial se lleva a cabo en la pluralidad de etapas de los cuantificadores de vectores 40051 \sim 40053 de los medios de cuantificación de varias etapas 4005, utilizando como ponderación para la cuantificación un coeficiente de ponderación en frecuencia, que se calcula en la unidad de cálculo de ponderación auditiva 4006, basándose en el espectro de la señal de audio de entrada, la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos y la envolvente espectral LPC. Por consiguiente, puede obtenerse una cuantificación eficaz utilizando la capacidad auditiva de los seres humanos.
En el aparato de codificación de señales de audio mostrado en la Figura 4, la unidad de cálculo de ponderación auditiva 4006 utiliza la envolvente espectral LPC para calcular el coeficiente de ponderación. No obstante, esta unidad puede calcular el coeficiente de ponderación utilizando sólo el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos.
Además, en el aparato de codificación de señales de audio mostrado en la Figura 4, la cuantificación se lleva a cabo, en toda la pluralidad de etapas de los cuantificadores de vectores de los medios de cuantificación de varias etapas 4005, utilizando el coeficiente de ponderación obtenido en la unidad de cálculo de ponderación auditiva 4006, basándose en la característica de sensibilidad auditiva. Siempre que en alguna de las diversas etapas de los cuantificadores de vectores de los medios de cuantificación de varias etapas 4005 la cuantificación se efectúe mediante el coeficiente de ponderación basado en la característica de sensibilidad auditiva, la cuantificación será más eficaz que la cuantificación en la que no se utiliza dicho coeficiente de ponderación basado en la característica de sensibilidad auditiva.
Forma de realización 2
La Figura 5 es un diagrama de bloques que ilustra la estructura de un aparato de codificación de señales de audio según una segunda forma de realización de la presente invención. A continuación, se describirá sólo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la forma de realización mencionada anteriormente. En la Figura 5, el número de referencia 50061 designa una primera unidad de cálculo de ponderación auditiva que proporciona un coeficiente de ponderación que será utilizado por el cuantificador de primera etapa 40051 de los medios de cuantificación de varias etapas 4005, basándose en el espectro de la señal de audio de entrada, la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos y la envolvente espectral LPC; 50062 designa una segunda unidad de cálculo de ponderación auditiva que proporciona un coeficiente de ponderación que será utilizado por el cuantificador de segunda etapa 40052 de los medios de cuantificación de varias etapas 4005, basándose en el espectro de la señal de audio de entrada, la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos y la envolvente espectral LPC; y 50063 designa una tercera unidad de cálculo de ponderación auditiva que proporciona un coeficiente de ponderación que será utilizado por el cuantificador de N-ésima etapa 40053 de los medios de cuantificación de varias etapas 4005, basándose en el espectro de la señal de audio de entrada, la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos y la envolvente espectral LPC.
En el aparato de codificación de señales de audio según la primera forma de realización, en toda la pluralidad de etapas de los cuantificadores de vectores de los medios de cuantificación de varias etapas 4005, la cuantificación se lleva a cabo utilizando el mismo coeficiente de ponderación obtenido en la unidad de cálculo de ponderación auditiva 4006. No obstante, en el aparato de codificación de señales de audio según esta segunda forma de realización, en la pluralidad de etapas de los cuantificadores de vectores de los medios de cuantificación de varias etapas 4005, la cuantificación se lleva a cabo utilizando los coeficientes de ponderación individuales obtenidos en las unidades de cálculo de ponderación auditiva primera a tercera 50061, 50062 y 50063, respectivamente. En este aparato de codificación de señales de audio según la segunda forma de realización, la cuantificación puede llevarse a cabo efectuando la ponderación de conformidad con la característica de ponderación en frecuencia obtenida en las unidades de ponderación auditiva 50061 a 50063, basada en la capacidad auditiva y, por consiguiente, reduciendo al mínimo el error debido a la cuantificación en cada etapa de los medios de cuantificación de varias etapas 4005. Por ejemplo, se calcula un coeficiente de ponderación basado en la envolvente espectral en la primera unidad de ponderación auditiva 50061, se calcula un coeficiente de ponderación basado en la característica de límite audible mínimo en la segunda unidad de ponderación auditiva 50062 y se calcula un coeficiente de ponderación basado en la característica de enmascaramiento auditivo en la tercera unidad de ponderación auditiva 50063.
Como se ha descrito anteriormente, según el aparato de codificación de señales de audio de la segunda forma de realización, puesto que en la pluralidad de etapas de los cuantificadores 40051 a 40053 de los medios de cuantificación de varias etapas 4005 se efectúa la cuantificación mediante los coeficientes de ponderación individuales obtenidos en las unidades de cálculo de ponderación auditiva 50061 a 50063, respectivamente, puede obtenerse una cuantificación efectiva utilizando con eficacia la capacidad auditiva de los seres humanos.
Forma de realización 3
La Figura 6 es un diagrama de bloques que ilustra la estructura de un aparato de codificación de señales de audio según una tercera forma de realización de la presente invención. A continuación, se describirá sólo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la forma de realización mencionada anteriormente. En la Figura 6, el número de referencia 60021 designa una unidad de cuantificación de primera etapa que efectúa la cuantificación vectorial de la señal MDCT normalizada; 60023 designa una unidad de cuantificación de segunda etapa que cuantifica la señal de error de cuantificación ocasionada en la cuantificación de la unidad de cuantificación de primera etapa 60021; y 60022 designa unos medios de selección auditiva que seleccionan, a partir del error de cuantificación ocasionado en la cuantificación de la unidad de cuantificación de primera etapa 60021, la banda de frecuencias de más importancia para cuantificar en la unidad de cuantificación de segunda etapa 60023, basándose en la característica de sensibilidad auditiva.
A continuación, se describirá el funcionamiento. Los coeficientes MDCT normalizados se someten a cuantificación vectorial en la unidad de cuantificación de primera etapa 60021. En los medios de selección auditiva 60022, basándose en la escala auditiva, se selecciona una banda de frecuencias en la que la señal de error ocasionada por la cuantificación vectorial es grande, y se extrae un bloque de la misma. En la unidad de cuantificación de segunda etapa 60023, la señal de error del bloque seleccionado se somete a cuantificación vectorial. Los resultados obtenidos en las respectivas unidades de cuantificación se proporcionan como índices.
La Figura 7 es un diagrama de bloques que ilustra en detalle las unidades de cuantificación de primera y segunda etapa y la unidad de selección auditiva, incluidas en el aparato de codificación de señales de audio mostrado en la Figura 6. En la Figura 7, el número de referencia 7031 designa un primer cuantificador de vectores que efectúa la cuantificación vectorial de los coeficientes MDCT normalizados; y 70032 designa un cuantificador inverso que efectúa la cuantificación inversa del resultado de cuantificación del primer cuantificador 70031, obteniéndose una señal del error de cuantificación zi ocasionado en la cuantificación del primer cuantificador 70031, calculando la diferencia entre la salida del cuantificador inverso 70032 y la señal residual si. El número de referencia 70033 designa la característica de sensibilidad auditiva hi que muestra la capacidad auditiva de los seres humanos (aquí se utiliza la característica de límite audible mínimo). El número de referencia 70035 designa un selector que selecciona la banda de frecuencias que será cuantificada por el segundo cuantificador de vectores 70036, a partir de la señal de error de cuantificación zi ocasionado en la cuantificación del primer cuantificador 70031. El número de referencia 70034 designa una unidad de cálculo de escala de selección que calcula una escala de selección para la operación de selección del selector 70035, basándose en la señal de error zi, la envolvente espectral LPC li y la característica de sensibilidad auditiva hi.
A continuación, se describirá en detalle la operación de selección de la unidad de selección auditiva.
En el primer cuantificador de vectores 70031, en primer lugar, la señal residual de una trama que comprende N elementos es dividida en una pluralidad de subvectores por un divisor de vectores del primer cuantificador de vectores 70031 mostrado en la Figura 8(a), y los respectivos subvectores se someten a cuantificación vectorial mediante los N elementos de cuantificadores 1\simN del primer cuantificador de vectores 70031. El procedimiento de división y cuantificación vectorial se describe a continuación. Por ejemplo, como se muestra en la Figura 8(b), los N elementos dispuestos por orden ascendente de frecuencia se dividen en NS elementos de subbloques a intervalos iguales y NS elementos de subvectores que comprenden N/NS elementos, de tal forma que se crea un subvector que sólo comprende los primeros elementos de los respectivos subbloques, un subvector que sólo comprende los segundos elementos de los mismos, y así sucesivamente, y se efectúa la cuantificación vectorial de todos los subvectores. El número de divisiones y otras cuestiones similares se deciden basándose en la velocidad de codificación deseada.
Tras la cuantificación vectorial, el cuantificador inverso 70032 efectúa la cuantificación inversa del código cuantificado para obtener la diferencia respecto de la señal de entrada y proporcionar, de ese modo, una señal de error zi en el primer cuantificador de vectores 70031 mostrado en la Figura 9(a).
A continuación, en el selector 70035, a partir de la señal de error zi, se selecciona un bloque de frecuencias que será cuantificado con más precisión por el segundo cuantificador 70036, basándose en el resultado seleccionado por la unidad de cálculo de escala de selección 70034.
En la unidad de cálculo de escala de selección 70034, utilizando la señal de error zi, la envolvente espectral LPC li (mostrada en la Figura 9(b)) obtenida en la unidad de análisis LPC y la característica de sensibilidad auditiva hi, se calcula para cada elemento de la trama dividida en N elementos en el eje de la frecuencia,
g = (zi * li) / hi.
Como característica de sensibilidad auditiva hi, se utiliza, por ejemplo, la característica de límite audible mínimo mostrada en la Figura 9(c). Esta característica muestra la zona que no puede ser oída por los seres humanos, obtenida experimentalmente. Por consiguiente, puede afirmarse que 1/hi, que es el inverso de la característica de sensibilidad auditiva hi, muestra la importancia auditiva de los seres humanos. Además, puede afirmarse que el valor g, que se obtiene multiplicando la señal de error zi, la envolvente espectral li y el inverso de la característica de sensibilidad auditiva hi, muestra la importancia de la cuantificación precisa en la frecuencia.
La Figura 10 es un diagrama de bloques que ilustra en detalle otros ejemplos de las unidades de cuantificación de primera y segunda etapa y la unidad de selección auditiva, incluidas en el aparato de codificación de señales de audio mostrado en la Figura 6. En la Figura 10, se utilizan los mismos números de referencia que en la Figura 7 para designar partes iguales o correspondientes. En el ejemplo mostrado en la Figura 10, la escala de selección (importancia) g se obtiene utilizando la envolvente espectral li y la característica de sensibilidad auditiva hi (sin utilizar la señal de error zi), calculando,
g = li / hi
La Figura 11 es un diagrama de bloques que ilustra en detalle otros ejemplos de las unidades de cuantificación de primera y segunda etapa y la unidad de selección auditiva, incluidas en el aparato de codificación de señales de audio mostrado en la Figura 6. En la Figura 11, se utilizan los mismos números de referencia que en la Figura 7 para designar partes iguales o correspondientes, y el número de referencia 11042 designa una unidad de cálculo de cantidad de enmascaramiento que calcula la cantidad para enmascarar mediante la característica de enmascaramiento auditivo, a partir del espectro de la frecuencia de audio de entrada que ha sido sometida a la transformada MDCT en la unidad de transformación tiempo-frecuencia.
En el ejemplo mostrado en la Figura 11, la característica de sensibilidad auditiva hi se obtiene de trama en trama de la forma descrita a continuación. A partir de la distribución espectral de la frecuencia de la señal de entrada, se calcula la característica de enmascaramiento, que se suma a la característica de límite audible mínimo para obtener, de ese modo, la característica de sensibilidad auditiva hi de la trama. El funcionamiento de la unidad de cálculo de escala de selección 70034 es idéntico al descrito en relación con la Figura 10.
La Figura 12 es un diagrama de bloques que ilustra en detalle otros ejemplos de las unidades de cuantificación de primera y segunda etapa y la unidad de selección auditiva, incluidas en el aparato de codificación de señales de audio mostrado en la Figura 6. En la Figura 12, se utilizan los mismos números de referencia que en la Figura 7 para designar partes iguales o correspondientes, y el número de referencia 12004 designa una unidad de corrección de cantidad de enmascaramiento que corrige la característica de enmascaramiento obtenida en la unidad de cálculo de cantidad de enmascaramiento 110042, mediante la envolvente espectral li, la señal residual si y la señal de error zi.
En el ejemplo mostrado en la Figura 12, la característica de sensibilidad auditiva hi se obtiene de trama en trama de la forma descrita a continuación. En primer lugar, se calcula la característica de enmascaramiento a partir de la distribución espectral de la frecuencia de la señal de entrada en la unidad de cálculo de cantidad de enmascaramiento 110042. A continuación, en la unidad de corrección de cantidad de enmascaramiento 120043, se corrige la característica de enmascaramiento calculada de conformidad con la envolvente espectral li, la señal residual si y la señal de error zi. La característica de sensibilidad de audio hi de la trama se obtiene sumando la característica de límite audible mínimo a la característica de enmascaramiento corregida. A continuación, se describirá un ejemplo de procedimiento para corregir la característica de enmascaramiento.
En un principio, se obtiene la frecuencia (fm) a la que la característica de cantidad de enmascaramiento Mi, que ya ha sido calculada, alcanza el valor máximo. Seguidamente, se determina con qué precisión se reproduce la señal que tiene la frecuencia fm a partir de la intensidad espectral de la frecuencia fm en la entrada y el tamaño del espectro del error de cuantificación. Por ejemplo,
\gamma = 1 -- (ganancia de error de cuantificación de fm) / (ganancia de fm en la entrada)
Cuando el valor de \gamma se aproxima a 1, no es necesario transformar la característica de enmascaramiento obtenida. Sin embargo, cuando este valor se aproxima a 0, la característica de enmascaramiento se corrige para disminuirla. Por ejemplo, la característica de enmascaramiento puede corregirse mediante transformación a una potencia superior con el coeficiente \gamma , de la siguiente forma:
(31)hi = Mi^{\gamma}
A continuación, se describirá el funcionamiento del selector 70035.
En el selector 70035, cada uno de los elementos continuos de la trama se multiplica por una ventana (longitud W), y se selecciona un bloque de frecuencias en el que el valor G obtenido por acumulación de los valores de importancia g dentro de la ventana alcanza el máximo. La Figura 13 es un diagrama que muestra un ejemplo en el que se selecciona el bloque de frecuencias (longitud W) que tiene más importancia. Para simplificar, se establecerá una longitud de ventana que sea un entero múltiplo de N/NS (en la Figura 13 se muestra una ventana cuya longitud no es un entero múltiplo). A la vez que se aplica un desplazamiento de N/NS elementos a la ventana, se calcula el valor G acumulado de valores de importancia g dentro de la trama de la ventana y se selecciona un bloque de frecuencias que tiene una longitud W que proporciona el valor máximo de G.
En el segundo cuantificador de vectores 70032, el bloque seleccionado de la trama de la ventana se somete a cuantificación vectorial. Aunque el funcionamiento del segundo cuantificador de vectores 70032 es idéntico al del primer cuantificador de vectores 70031, ya que sólo se cuantifica, de la forma descrita anteriormente, el bloque de frecuencias seleccionado por el selector 70035 a partir de la señal de error zi, el número de elementos de la trama que se van a someter a cuantificación vectorial es pequeño.
Por último, en caso de que se utilice el código del coeficiente de la envolvente espectral, los códigos correspondientes a los resultados de cuantificación de los respectivos cuantificadores de vectores, la escala de selección g obtenida en cualquiera de las estructuras mostradas en las Figuras 7, 11 y 12 y la información que muestra a partir de qué elemento empieza el bloque seleccionado por el selector 70035 se obtienen en forma de índice.
Por otra parte, en caso de que se utilice la escala de selección g obtenida en la estructura mostrada en la Figura 10, puesto que sólo se utiliza la envolvente espectral li y la característica de sensibilidad auditiva hi, la información (que indica, por ejemplo, a partir de qué elemento empieza el bloque seleccionado) puede obtenerse a partir del código del coeficiente de envolvente espectral y la característica de sensibilidad auditiva hi conocida previamente cuando se lleva a cabo la cuantificación inversa. Por consiguiente, no es necesario proporcionar la información relativa a la selección de bloque como un índice, lo que representa una ventaja respecto de la compresibilidad.
Como se ha descrito anteriormente, según el aparato de codificación de señales de audio de la tercera forma de realización, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, se selecciona el bloque de frecuencias de más importancia para la cuantificación a partir de los bloques de frecuencias del componente de error de cuantificación del primer cuantificador de vectores, y se cuantifica el componente de error de cuantificación del primer cuantificador respecto del bloque seleccionado en el segundo cuantificador de vectores, pudiéndose obtener de ese modo una eficaz cuantificación utilizando la capacidad auditiva de los seres humanos. Además, en las estructuras mostradas en las Figuras 7, 11 y 12, cuando se selecciona el bloque de frecuencias de más importancia para la cuantificación, la importancia se calcula basándose en el error de cuantificación del primer cuantificador de vectores. De este modo, se impide que una parte cuantificada favorablemente en el primer cuantificador de vectores sea cuantificada de nuevo y que se genere un error de forma inversa, manteniéndose una cuantificación de alta calidad.
Además, cuando la importancia g se obtiene en la estructura mostrada en la Figura 10, el número de índices generados es inferior al número de índices generados cuando la importancia g se obtiene en la estructura mostrada en cualquiera de las Figuras 7, 11 ó 12, lo que determina un aumento de la relación de compresión.
En esta tercera forma de realización, la unidad de cuantificación tiene la estructura de dos etapas que comprende la unidad de cuantificación de primera etapa 60021 y la unidad de cuantificación de segunda etapa 60023, y los medios de selección auditiva 60022 se hallan entre la unidad de cuantificación de primera etapa 60021 y la unidad de cuantificación de segunda etapa 60023. No obstante, la unidad de cuantificación puede tener una estructura de tres o más etapas y los medios de selección auditiva pueden estar situados entre las respectivas unidades de cuantificación. Asimismo, como en la tercera forma de realización mencionada anteriormente, en esta estructura puede llevarse a cabo una cuantificación eficaz utilizando la capacidad auditiva de los seres humanos.
Forma de realización 4
La Figura 14 es un diagrama de bloques que ilustra la estructura de un aparato de codificación de señales de audio según una cuarta forma de realización de la presente invención. A continuación, se describirá solo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la forma de realización mencionada anteriormente. En la Figura, el número de referencia 140011 designa un cuantificador de primera etapa que efectúa la cuantificación vectorial de la señal MDCT si obtenida de la unidad de normalización 104, utilizando el valor de envolvente espectral li como coeficiente de ponderación. El número de referencia 140012 designa un cuantificador inverso que efectúa la cuantificación inversa del resultado de la cuantificación del cuantificador de primera etapa 140011. Se obtiene una señal de error de cuantificación zi de la cuantificación efectuada por el cuantificador de primera etapa 140011, calculando la diferencia entre la salida de este cuantificador inverso 140012 y la señal residual proporcionada por la unidad de normalización 104. El número de referencia 140013 designa un cuantificador de segunda etapa que efectúa la cuantificación vectorial de la señal de error de cuantificación zi de la cuantificación efectuada por el cuantificador de primera etapa 140011 utilizando, como coeficiente de ponderación, el resultado del cálculo obtenido en la unidad de cálculo de ponderación 140017 descrita más adelante. El número de referencia 140014 designa un cuantificador inverso que efectúa la cuantificación inversa del resultado de la cuantificación del cuantificador de segunda etapa 140013. Se obtiene una señal de error de cuantificación z2i de la cuantificación efectuada por el cuantificador de segunda etapa 140013, calculando la diferencia entre la salida del cuantificador inverso 140014 y la señal de error de cuantificación de la cuantificación efectuada por el cuantificador de primera etapa 140011. El número de referencia 141005 designa un cuantificador de tercera etapa que efectúa la cuantificación vectorial de la señal de error de cuantificación z2i de la cuantificación efectuada por el cuantificador de segunda etapa 140013, utilizando como coeficiente de ponderación el resultado del cálculo obtenido en la unidad de cálculo de ponderación auditiva 4006. El número de referencia 140016 designa una unidad de cálculo de correlación que calcula la correlación entre la señal de error de cuantificación zi de la cuantificación efectuada por el cuantificador de primera etapa 140011 y el valor de envolvente espectral li. El número de referencia 140017 designa una unidad de cálculo de ponderación que calcula el coeficiente de ponderación utilizado en la cuantificación efectuada por el cuantificador de segunda etapa 140013.
A continuación, se describirá el funcionamiento. En el aparato de codificación de señales de audio según la cuarta forma de realización, se emplean tres etapas de cuantificadores y la cuantificación vectorial se lleva a cabo utilizando ponderaciones diferentes en los respectivos cuantificadores.
Inicialmente, en el cuantificador de primera etapa 140013, la señal residual de entrada si se somete a cuantificación vectorial utilizando, como coeficiente de ponderación, el valor de envolvente espectral LPC li obtenido en la unidad de cuantificación de perfil 302. En consecuencia, una parte de energía espectral elevada (concentrada) se somete a ponderación, lo que determina que se cuantifique con mayor eficacia una parte que tiene importancia auditiva. Como cuantificador de vectores de primera etapa 140013 puede utilizarse, por ejemplo, un cuantificador idéntico al primer cuantificador de vectores 70031 según la tercera forma de realización.
El resultado de la cuantificación se somete a cuantificación inversa en el cuantificador inverso 140012 y, a partir de la diferencia entre éste y la señal residual de entrada si, se obtiene la señal de error zi ocasionado por la cuantificación.
Esta señal de error zi es sometida además a cuantificación vectorial por el cuantificador de segunda etapa 140013. En este caso, basándose en la correlación entre la envolvente espectral LPC li y la señal de error zi, se calcula un coeficiente de ponderación en la unidad de cálculo de correlación 140016 y la unidad de cálculo de ponderación 140017.
Para concretar, en la unidad de cálculo de correlación 140016, se calcula
\alpha = (\sum li \ \text{*} \ zi)/(\sum li \ \text{*} \ li)
\alpha toma un valor que cumple 0 < \alpha < 1 y muestra la correlación entre ambas. Cuando \alpha se aproxima a 0, indica que la cuantificación de primera etapa se ha efectuado con precisión basándose en la ponderación de la envolvente espectral. Cuando \alpha se aproxima a 1, indica que la cuantificación todavía no ha sido efectuada con precisión. Por lo tanto, utilizando \alpha como coeficiente para ajustar el grado de ponderación de la envolvente espectral li, se obtiene
(32)li^{\alpha}
y este resultado se utiliza como coeficiente de ponderación para la cuantificación vectorial. Se puede mejorar la precisión de la cuantificación volviendo a efectuar la ponderación mediante la envolvente espectral según la precisión de la cuantificación de la primera etapa y, a continuación, efectuando la cuantificación de la forma indicada anteriormente.
El resultado de la cuantificación efectuada por el cuantificador de segunda etapa 140013 se somete a cuantificación inversa en el cuantificador inverso 140014 de forma similar, y se extrae una señal de error z2i que es sometida a cuantificación vectorial por el cuantificador de tercera etapa 140015. El coeficiente de ponderación auditiva esta vez es calculado por el calculador de ponderación A19 de la unidad de cálculo de ponderación auditiva 14006. Por ejemplo, utilizando la señal de error z2i, la envolvente espectral LPC li y la señal residual si, se obtiene:
N = \sum z2li \ \text{*} \ li
S = \sum si \ \text{*} \ li
\beta = 1 - (N/S)
Por otra parte, en el calculador de enmascaramiento auditivo 140018 de la unidad de cálculo de ponderación auditiva 14006, la característica de enmascaramiento auditivo mi se calcula, por ejemplo, según un modelo auditivo utilizado en un procedimiento del estándar de audio MPEG. Ésta se solapa con la característica de límite audible mínimo descrita anteriormente hi para obtener la característica de enmascaramiento Mi definitiva.
A continuación, la característica de enmascaramiento Mi definitiva se eleva a una potencia superior utilizando el coeficiente \beta calculado en la unidad de cálculo de ponderación 140019, y el inverso de este valor se multiplica por 1 para obtener
(33)l/Mi^{\beta}
siendo este resultado utilizado como coeficiente de ponderación para la cuantificación vectorial de la tercera etapa.
Como se ha indicado anteriormente, en el aparato de codificación de señales de audio según esta cuarta forma de realización, la pluralidad de cuantificadores 140011, 140013 y 140015 llevan a cabo la cuantificación utilizando diferentes coeficientes de ponderación (incluida la ponderación que tiene en cuenta la característica de sensibilidad auditiva) y de ese modo puede efectuarse una cuantificación efectiva utilizando eficazmente la capacidad auditiva de los seres humanos.
Forma de realización 5
La Figura 15 es un diagrama de bloques que ilustra la estructura de un aparato de codificación de señales de audio según una quinta forma de realización de la presente invención.
El aparato de codificación de señales de audio según esta quinta forma de realización es una combinación de la tercera forma de realización mostrada en la Figura 6 y la primera forma de realización mostrada en la Figura 4. En el aparato de codificación de señales de audio según la tercera forma de realización mostrado en la Figura 6, se utiliza un coeficiente de ponderación, que se obtiene utilizando la característica de sensibilidad auditiva en la unidad de cálculo de ponderación auditiva 4006, cuando se lleva a cabo la cuantificación en cada una de las unidades de cuantificación. Gracias a la estructura del aparato de codificación de señales de audio según la quinta forma de realización, se obtienen los resultados proporcionados por la primera forma de realización y la tercera forma de realización.
Asimismo, también es posible combinar la tercera forma de realización mostrada en la Figura 6 con la estructura de la segunda forma de realización o la cuarta forma de realización y, entonces, el aparato de codificación de señales de audio obtenido mediante cada combinación puede proporcionar tanto los resultados de la segunda forma de realización y la tercera forma de realización, como los resultados de la cuarta forma de realización y la tercera forma de realización.
Aunque en las formas de realización primera a cuarta mencionadas la unidad de cuantificación de varias etapas tiene dos o tres etapas de unidades de cuantificación, huelga decir que el número de etapas de la unidad de cuantificación puede ser de cuatro o más.
Además, el orden de los coeficientes de ponderación utilizados para la cuantificación vectorial en las respectivas etapas de la unidad de cuantificación de varias etapas no está limitado al descrito en las formas de realización anteriores. Por ejemplo, el coeficiente de ponderación que tiene en cuenta la característica de sensibilidad auditiva puede utilizarse en la primera etapa y la envolvente espectral LPC puede utilizarse en la segunda etapa y después de ésta.
\newpage
Forma de realización 6
La Figura 16 es un diagrama de bloques que ilustra un aparato de codificación de señales de audio según una sexta forma de realización de la presente invención. A continuación, se describirá sólo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la forma de realización mencionada anteriormente.
En la Figura 16, el número de referencia 401 designa una primera unidad de subcuantificación, 402 designa una segunda unidad de subcuantificación que recibe la salida de la primera unidad de subcuantificación 401, y 403 designa una tercera unidad de subcuantificación que recibe la salida de la segunda unidad de subcuantificación 402.
A continuación, se describirá el funcionamiento de la unidad de cuantificación 105. La señal introducida en la primera unidad de subcuantificación 401 es la salida de la unidad de normalización 104 del aparato de codificación, es decir, los coeficientes MDCT. No obstante, en la estructura que no incluye una unidad de normalización 104, la entrada es la salida de la unidad MDCT 103. En la primera unidad de subcuantificación 401, los coeficientes MDCT de entrada se someten a cuantificación escalar o cuantificación vectorial, y se codifican índices que expresan los parámetros utilizados para la cuantificación. Además, se calculan los errores de cuantificación respecto de los coeficientes MDCT de entrada ocasionados por la cuantificación y se proporcionan a la segunda unidad de subcuantificación 402. En la primera unidad de subcuantificación 401, pueden cuantificarse todos los coeficientes MDCT o sólo una parte de ellos. Naturalmente, cuando sólo se cuantifica una parte de estos coeficientes, los errores de cuantificación de las bandas que no son cuantificadas por la primera unidad de subcuantificación 401 serán los coeficientes MDCT de entrada de las bandas no cuantificadas.
A continuación, la segunda unidad de subcuantificación 402 recibe los errores de cuantificación de los coeficientes MDCT obtenidos en la primera unidad de subcuantificación 401 y los cuantifica. Como en la primera unidad de subcuantificación 401, esta cuantificación puede ser escalar o vectorial. La segunda unidad de subcuantificación 402 codifica los parámetros utilizados para la cuantificación como índices. Además, calcula los errores de cuantificación ocasionados por la cuantificación y los proporciona a la tercera unidad de subcuantificación 403. Esta tercera unidad de subcuantificación 403 es idéntica en cuanto a estructura a la segunda unidad de subcuantificación.
No es necesario que los números de coeficientes MDCT, es decir, los anchos de banda, que van a ser cuantificados por la primera unidad de subcuantificación 401, la segunda unidad de subcuantificación 402 y la tercera unidad de subcuantificación 403 sean iguales entre sí, ni que las bandas que se van a cuantificar sean las mismas. Teniendo en cuenta la característica auditiva de los seres humanos, es deseable que tanto la segunda unidad de subcuantificación 402 como la tercera unidad de subcuantificación 403 estén destinadas a cuantificar la banda de los coeficientes MDCT que presentan el componente de baja frecuencia.
Como se ha descrito anteriormente en relación con la sexta forma de realización de la presente invención, cuando se efectúa la cuantificación, la unidad de cuantificación se proporciona en etapas, y el ancho de banda que va a ser cuantificado por la unidad de cuantificación varía entre las etapas adyacentes, cuantificándose de ese modo los coeficientes de una banda arbitraria de los coeficientes MDCT de entrada, por ejemplo, los coeficientes correspondientes al componente de baja frecuencia que tiene importancia auditiva para los seres humanos. Por consiguiente, aunque la señal de audio se codifique a una velocidad binaria baja (es decir, con una alta relación de compresión), es posible efectuar una reproducción de audio de alta definición en el sector de recepción.
Forma de realización 7
A continuación, se describirá un aparato de codificación de señales de audio según una séptima forma de realización de la presente invención, en relación con la Figura 17. A continuación, se describirá sólo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la forma de realización mencionada anteriormente. En la Figura 17, el número de referencia 501 designa una primera unidad de subcuantificación (cuantificador vectorial), 502 designa una segunda unidad de subcuantificación y 503 designa una tercera unidad de subcuantificación. Esta séptima forma de realización es diferente en cuanto a estructura de la sexta forma de realización, en la medida en que la primera unidad de cuantificación 501 divide los coeficientes MDCT de entrada en tres bandas y cuantifica las respectivas bandas de forma independiente. En general, cuando la cuantificación se lleva a cabo mediante un método de cuantificación vectorial, los vectores se forman extrayendo algunos elementos de los coeficientes MDCT de entrada. En la primera unidad de subcuantificación 501 según la séptima forma de realización, cuando se crean vectores extrayendo algunos elementos de los coeficientes MDCT, la cuantificación de la banda baja se lleva a cabo utilizando sólo los elementos de la banda baja, la cuantificación de la banda intermedia se lleva a cabo utilizando sólo los elementos de la banda intermedia y la cuantificación de la banda alta se lleva a cabo utilizando sólo los elementos de la banda alta, y de esta forma las respectivas bandas se someten a cuantificación vectorial. La primera unidad de subcuantificación 501 mostrada se compone de tres cuantificadores de vectores divididos.
Aunque en esta séptima forma de realización, se describe como ejemplo un procedimiento para dividir la banda que se va a cuantificar en tres bandas (banda baja, banda intermedia y banda alta), la banda puede dividirse en un número de bandas distinto de tres. Además, respecto de la segunda unidad de subcuantificación 502 y la tercera unidad de subcuantificación 503, así como de la primera unidad de cuantificación 501, la banda que se va a cuantificar puede dividirse en varias bandas.
Como se ha descrito anteriormente, según la séptima forma de realización de la presente invención, cuando se lleva a cabo la cuantificación, los coeficientes MDCT de entrada se dividen en tres bandas y se cuantifican de forma independiente para que el método de cuantificación de la banda de importancia auditiva con prioridad pueda llevarse a cabo en la primera cuantificación. Además, en las subsiguientes unidades de cuantificación 502 y 503, los coeficientes MDCT de esta banda son sometidos a una posterior cuantificación por etapas, con lo que se reduce todavía más el error de cuantificación y se obtiene una reproducción de audio de definición más alta en el sector de recepción.
Forma de realización 8
A continuación, se describirá un aparato de codificación de señales de audio según una octava forma de realización de la presente invención, en relación con la Figura 18. A continuación, se describirá sólo la estructura de la unidad de cuantificación 105 del aparato de codificación 1, puesto que es la única diferencia de esta forma de realización respecto de la primera forma de realización mencionada anteriormente. En la Figura 18, el número de referencia 601 designa una primera unidad de subcuantificación, 602 designa una primera unidad de selección de banda de cuantificación, 603 designa una segunda unidad de subcuantificación, 604 designa una segunda unidad de selección de banda de cuantificación y 605 designa una tercera unidad de subcuantificación. Esta octava forma de realización es diferente en cuanto a estructura de la sexta y la séptima forma de realización, en la medida en que se añade la primera unidad de selección de banda de cuantificación 602 y la segunda unidad de selección de banda de cuantificación 604.
A continuación, se describirá el funcionamiento. La primera unidad de selección de banda de cuantificación 602 calcula una banda, cuyos coeficientes MDCT van a ser cuantificados por la segunda unidad de subcuantificación 602, utilizando el error de cuantificación obtenido de la primera unidad de subcuantificación 601.
Por ejemplo, se calcula el valor j que incrementa al máximo el término esum(j) proporcionado en la fórmula (10), y se cuantifica la banda comprendida entre j*OFFSET y j*OFFSET+ BANDWIDTH
11
siendo OFFSET la constante y BANDWITH la muestra total correspondiente a un ancho de banda que va a ser cuantificado por la segunda unidad de subcuantificación 603. La primera unidad de selección de banda de cuantificación 602 codifica, por ejemplo, el valor j que proporciona el valor máximo en la fórmula (10) como un índice. La segunda unidad de subcuantificación 603 cuantifica la banda seleccionada por la primera unidad de selección de banda de cuantificación 602. La segunda unidad de selección de banda de cuantificación 604 se ejecuta mediante la misma estructura que la primera unidad de selección, excepto en que la entrada es el error de cuantificación obtenido de la segunda unidad de subcuantificación 603, y la banda seleccionada por la segunda unidad de selección de banda de cuantificación 604 se introduce en la tercera unidad de subcuantificación 605.
Aunque, en la primera unidad de selección de banda de cuantificación 602 y la segunda unidad de selección de banda de cuantificación 604, se selecciona la banda que va a ser cuantificada por la siguiente unidad de cuantificación mediante la fórmula (10), ésta puede calcularse mediante el valor obtenido multiplicando el valor utilizado en la normalización por la unidad de normalización 104 y el valor que tiene en cuenta la característica de sensibilidad auditiva de los seres humanos en relación con las frecuencias, como se muestra en la fórmula (11)
12
en la que env(i) se obtiene dividiendo la salida de la unidad MDCT 103 por la salida de la unidad de normalización 104, y zxc(i) es la tabla que tiene en cuenta la característica de sensibilidad auditiva de los seres humanos relativa a las frecuencias, mostrándose un ejemplo de la misma en el gráfico 2. En la fórmula (11), zxc(i) puede ser siempre 1 y, entonces no se considera.
\newpage
GRÁFICO 2
13
Además, no es necesario proporcionar unidades de selección de banda de cuantificación de varias etapas, es decir, puede utilizarse sólo la primera unidad de selección de banda de cuantificación 602 o la segunda unidad de banda de cuantificación 604.
Como se ha descrito anteriormente, según la octava forma de realización, cuando la cuantificación se lleva a cabo en varias etapas, se dispone una unidad de selección de banda de cuantificación entre unidades de cuantificación de etapas adyacentes para que la banda que se va a cuantificar sea variable. De ese modo, la banda que se va a cuantificar puede variarse según la señal de entrada, y el grado de libertad de la cuantificación aumenta.
De ahora en adelante, se describirá con detalle el funcionamiento del método de cuantificación de la unidad de cuantificación incluida en el aparato de codificación 1 según cualquiera de las formas de realización primera a octava, en relación con las Figuras 1 y 19. Algunos de los coeficientes MDCT normalizados 1401 introducidos en cada unidad de subcuantificación se extraen según una regla para la generación de subvectores de fuente de sonido 1403. Del mismo modo, si se supone que las cadenas de coeficientes, que se obtienen dividiendo los coeficientes MDCT que van a introducirse en la unidad de normalización 104 por los coeficientes MDCT 1401 normalizados en la unidad de normalización 104, son componentes normalizados 1402, algunos de estos componentes se extraen según la misma regla de extracción de subvectores de fuente de sonido a partir de los coeficientes MDCT 1401, generándose de ese modo subvectores de ponderación 1404. La regla para extraer los subvectores de fuente de sonido 1403 y los subvectores de ponderación 1404 a partir de los coeficientes MDCT 1401 y los componentes normalizados 1402, respectivamente, se muestra, por ejemplo, en la fórmula (14):
14
en la que el j-ésimo elemento del i-ésimo subvector de fuente de sonido es el subvector_{i}(j), los coeficientes MDCT son vector( ), el número total de elementos de coeficientes MDCT es TOTAL, el número de elementos de subvectores de fuente de sonido 1403 es CR, VTOTAL se establece en un valor igual o superior a TOTAL y VTOTAL/CR debe ser un entero. Por ejemplo, cuando TOTAL es 2048, CR = 19 y VTOTAL = 2052 o CR = 23 y VTOTAL = 2070 o CR = 21 y VTOTAL = 2079. Los subvectores de ponderación 19001404 pueden extraerse mediante el procedimiento de la fórmula (14). El cuantificador de vectores 1405 selecciona, a partir de los vectores de códigos del libro de códigos 1409, un vector de código que se halla a una distancia mínima del subvector de fuente de sonido 1403, tras haber sido ponderado mediante el subvector de ponderación 1404. A continuación, el cuantificador 1405 proporciona el índice del vector de código que se halla a la distancia mínima, y un subvector residual 1404 que corresponde al error de cuantificación entre el vector de código que se halla a la distancia mínima y el subvector de fuente de sonido de entrada 1403. A continuación, se describirá un ejemplo de un procedimiento de cálculo concreto basado en la premisa de que el cuantificador de vectores 1405 está constituido por tres componentes: unos medios de cálculo de distancia 1406, unos medios de selección de código 1407 y unos medios de generación de residuo 1408. Los medios de cálculo de distancia 1406 calculan la distancia entre el i-ésimo subvector de fuente de sonido 1403 y el k-ésimo vector de código del libro de códigos 1409 utilizando, por ejemplo, la fórmula (15):
15
en la que wj es el j-ésimo elemento del subvector de ponderación, ck(j) es el j-ésimo elemento del k-ésimo vector de código, R y S son reglas para el cálculo de la distancia (siendo deseable que los valores de R y S sean 1, 1,5 y 2). Estas reglas R y S pueden tener diferentes valores. Además, dik es la distancia que separa el k-ésimo vector de código del i-ésimo subvector de fuente de sonido. Los medios de selección de código 1407 seleccionan el vector de código que tiene la distancia mínima de todas las distancias calculadas mediante la fórmula (15) o similar, y codifica el índice del mismo. Por ejemplo, cuando diu es el valor mínimo, el índice que se va a codificar para el i-ésimo subvector es u. Los medios de generación de residuo 1408 generan subvectores residuales 1410 mediante los vectores de código seleccionados por los medios de selección de código 1407, según la fórmula (16)
16
en la que el j-ésimo elemento del i-ésimo subvector residual 1410 es resi(j), y el j-ésimo elemento del vector de código seleccionado por los medios de selección de código 1407 es cu(j). Los subvectores residuales 1410 se conservan como coeficientes MDCT para ser cuantificados por las subsiguientes unidades de subcuantificación, efectuando el procedimiento inverso de la fórmula (14) o similar. No obstante, cuando la banda que se está cuantificando no influye en las subsiguientes unidades de subcuantificación, es decir, cuando no se necesitan las subsiguientes unidades de subcuantificación para llevar a cabo la cuantificación, los medios de generación de residuo 1408, los subvectores residuales 1410 y la generación de los coeficientes MDCT 1411 no son necesarios. Aunque el número de vectores de código incluidos en el libro de códigos 1409 no se indica, cuando se tiene en cuenta la capacidad de memoria, el tiempo de cálculo y similares, el número deseado es de alrededor de 64.
Existe otra forma de realización del cuantificador de vectores 1405 con la estructura descrita a continuación. Los medios de cálculo de distancia 1406 calculan la distancia utilizando la fórmula (17)
17
en la que K es el número total de vectores de código utilizados para la recuperación de códigos del libro de códigos 1409.
Los medios de selección de código 1407 seleccionan el valor de k que proporciona el valor mínimo de la distancia dik calculada en la fórmula (17) y codifican el índice del mismo. En este caso, k es un valor que oscila entre 0 y 2K-1. Los medios de generación de residuo 1408 generan los subvectores residuales 1410 utilizando la fórmula (18).
18
Aunque el número de vectores de código incluidos en el libro de códigos 1409 no está limitado, cuando se tienen en cuenta la capacidad de memoria, el tiempo de cálculo y cuestiones similares, es deseable que sea de alrededor de 64.
Además, aunque los subvectores de ponderación 1404 se generan a partir de los componentes normalizados 1402, es posible generar subvectores de ponderación multiplicando los subvectores de ponderación 1404 por una ponderación que tenga en cuenta la característica auditiva de los seres humanos.
Forma de realización 9
A continuación, se describirá un aparato de decodificación de señales de audio según una novena forma de realización de la presente invención, en relación con las Figuras 20 a 24. Los índices proporcionados por el aparato de codificación 1 se dividen en términos generales en los índices proporcionados por la unidad de normalización 104 y los índices proporcionados por la unidad de cuantificación 105. Los índices proporcionados por la unidad de normalización 104 se decodifican en la unidad de normalización inversa 107 y los índices proporcionados por la unidad de cuantificación 105 se decodifican en la unidad de cuantificación inversa B106. La unidad de cuantificación inversa 106 puede efectuar la decodificación utilizando sólo una parte de los índices proporcionados por la unidad de cuantificación 105.
Partiendo del supuesto de que la unidad de cuantificación 105 tiene la estructura mostrada en la Figura 17, se describe el caso en el que la cuantificación inversa se lleva a cabo utilizando la unidad de cuantificación inversa que tiene la estructura de la Figura 20. En la Figura 20, el número de referencia 701 designa una primera unidad de cuantificación inversa de componentes de banda baja. La primera unidad de cuantificación inversa de componentes de banda baja 701 efectúa la decodificación utilizando sólo los índices de los componentes de banda baja del primer subcuantificador 501.
De este modo, independientemente de la cantidad de datos transmitidos desde el aparato de codificación 1, puede decodificarse una cantidad arbitraria de datos de la señal de audio codificada y, en consecuencia, la cantidad de datos codificados puede ser diferente de la cantidad de datos decodificados. Por lo tanto, la cantidad de datos que se van a decodificar puede variarse según el entorno de comunicación del sector de recepción, pudiéndose obtener un sonido estable de alta definición y calidad aun cuando se utilice una red telefónica pública corriente.
La Figura 21 es un diagrama que muestra la estructura de la unidad de cuantificación inversa incluida en el aparato de decodificación de señales de audio, que se emplea cuando la cuantificación inversa se lleva a cabo en dos etapas. En la Figura 21, el número de referencia 704 designa una segunda unidad de cuantificación inversa. Esta segunda unidad de cuantificación inversa 704 lleva a cabo la decodificación utilizando los índices de la segunda unidad de subcuantificación 502. En consecuencia, la salida de la primera unidad de cuantificación inversa de componentes de banda baja 701 y la salida de la segunda unidad de cuantificación inversa 704 se suman y la suma se obtiene desde la unidad de cuantificación inversa 106. Esta suma se lleva a cabo en la misma banda que la banda cuantificada por cada unidad de subcuantificación en la cuantificación.
Como se ha descrito anteriormente, los índices de la primera unidad de subcuantificación (banda baja) se decodifican en la primera unidad de cuantificación inversa de componentes de banda baja 701 y, una vez que los índices de la segunda unidad de subcuantificación se han sometido a cuantificación inversa, la salida de la primera unidad de cuantificación inversa de componentes de banda baja 701 se suma a los mismos, es decir, la cuantificación inversa se lleva a cabo en dos etapas. Por consiguiente, la señal de audio cuantificada en varias etapas puede decodificarse con precisión, obteniéndose un sonido de más alta calidad.
Además, la Figura 22 es un diagrama que ilustra la estructura de la unidad de cuantificación inversa incluida en el aparato de decodificación de señales de audio, en el que la banda objeto de procesamiento se amplía cuando se lleva a cabo la cuantificación inversa de dos etapas. En la Figura 22, el número de referencia 702 designa una primera unidad de cuantificación inversa de componentes de banda intermedia. Esta primera unidad de cuantificación inversa de componentes de banda intermedia 702 lleva a cabo la decodificación utilizando los índices de los componentes de banda intermedia de la primera unidad de subcuantificación 501. En consecuencia, la salida de la primera unidad de cuantificación inversa de componentes de banda baja 701, la salida de la segunda unidad de cuantificación inversa 704 y la salida de la primera unidad de cuantificación inversa de componentes de banda intermedia 702 se suman y la suma se obtiene desde la unidad de cuantificación inversa 106. Esta suma se lleva a cabo en la misma banda que la banda cuantificada por cada unidad de subcuantificación en la cuantificación. De este modo, la banda del sonido reproducido se amplía y se reproduce una señal de audio de más alta calidad.
Además, la Figura 23 es un diagrama que muestra la estructura de la unidad de cuantificación inversa incluida en el aparato de decodificación de señales de audio, en el que la cuantificación inversa se lleva a cabo en tres etapas mediante dicha unidad de cuantificación inversa que tiene la estructura de la Figura 22. En la Figura 23, el número de referencia 705 designa una tercera unidad de cuantificación inversa. La tercera unidad de cuantificación inversa 705 lleva a cabo la decodificación utilizando los índices de la tercera unidad de subcuantificación 503. En consecuencia, la salida de la primera unidad de cuantificación inversa de componentes de banda baja 701, la salida de la segunda unidad de cuantificación inversa 704, la salida de la primera unidad de cuantificación inversa de componentes de banda intermedia 702 y la salida de la tercera unidad de cuantificación inversa 705 se suman, y la suma se obtiene desde la unidad de cuantificación inversa 106. Esta suma se lleva a cabo en la misma banda que la banda cuantificada por cada unidad de subcuantificación en la cuantificación.
Además, la Figura 24 es un diagrama que ilustra la estructura de la unidad de cuantificación inversa incluida en el aparato de decodificación de señales de audio, en el que la banda objeto de procesamiento se amplía cuando se lleva a cabo la cuantificación inversa de tres etapas en la unidad de cuantificación inversa que tiene la estructura de la Figura 23. En la Figura 24, el número de referencia 703 designa una primera unidad de cuantificación inversa de componentes de banda alta. Esta primera unidad de cuantificación inversa de componentes de banda alta 703 lleva a cabo la decodificación utilizando los índices de los componentes de banda alta de la primera unidad de subcuantificación 501. En consecuencia, la salida de la primera unidad de cuantificación inversa de componentes de banda baja 701, la salida de la segunda unidad de cuantificación inversa 704, la salida de la primera unidad de cuantificación inversa de componentes de banda intermedia 702, la salida de la tercera unidad de cuantificación inversa 705 y la salida de la primera unidad de cuantificación inversa de componentes de banda alta 703 se suman y la suma se obtiene desde la unidad de cuantificación inversa 106. Esta suma se lleva a cabo en la misma banda que la banda cuantificada por cada unidad de subcuantificación en la cuantificación.
Aunque esta novena forma de realización se describe para el caso en el que la unidad de decodificación 106 efectúa la decodificación inversa de los datos cuantificados por la unidad de cuantificación 105 que tiene la estructura de la Figura 7, también es posible llevar a cabo una cuantificación inversa similar aunque la unidad de cuantificación 105 tenga la estructura mostrada en la Figura 16 ó 18.
Además, cuando la codificación se lleva a cabo utilizando la unidad de cuantificación que tiene la estructura mostrada en la Figura 17 y la decodificación se lleva a cabo utilizando la unidad de cuantificación inversa que tiene la estructura mostrada en la Figura 24, como se muestra en la Figura 25, una vez que se ha efectuado la cuantificación inversa de los índices de banda baja de la primera unidad de subcuantificación, se efectúa la cuantificación inversa de los índices de la segunda unidad de subcuantificación 502 en la siguiente etapa y la cuantificación inversa de los índices de banda intermedia de la primera unidad de subcuantificación. De esta forma, la cuantificación inversa para ampliar la banda y la cuantificación inversa para reducir el error de cuantificación se repiten de forma alternada. No obstante, cuando una señal codificada por la unidad de cuantificación que tiene la estructura mostrada en la Figura 16 se decodifica utilizando la unidad de cuantificación inversa que tiene la estructura mostrada en la Figura 24, puesto que no existen bandas divididas, los coeficientes cuantificados son decodificados de forma sucesiva por la unidad de cuantificación inversa en la siguiente etapa.
A continuación, se describe con detalle el funcionamiento de la unidad de cuantificación inversa 107 que forma parte del aparato de decodificación de señales de audio 2, en relación con la Figura 1 y la Figura 26.
Por ejemplo, la unidad de cuantificación inversa 107 se compone de la primera unidad de cuantificación inversa de banda baja 701 cuando tiene la unidad de cuantificación inversa mostrada en la Figura 20, y se compone de dos unidades de cuantificación inversa (la primera unidad de cuantificación inversa de banda baja 701 y la segunda unidad de cuantificación inversa 704) cuando tiene la unidad de cuantificación inversa mostrada en la Figura 21.
El cuantificador inverso de vectores 1501 reproduce los coeficientes MDCT mediante los índices de la unidad de cuantificación de vectores 105. Cuando la unidad de subcuantificación tiene la estructura mostrada en la Figura 20, la cuantificación inversa se lleva a cabo de la forma descrita a continuación. Se decodifica un número de índice y se selecciona un vector de código del libro de códigos 1502 que tiene este número. Se supone que el contenido del libro de códigos 1502 es idéntico al del libro de códigos del aparato de codificación. El vector de código seleccionado se convierte, como vector reproducido 1503, en un coeficiente MDCT 1504 sometido a cuantificación inversa mediante el procedimiento inverso de la fórmula (14).
Cuando la unidad de subcuantificación tiene la estructura mostrada en la Figura 21, la cuantificación inversa se lleva a cabo de la forma descrita a continuación. Se decodifica un número de índice k y se selecciona un vector de código del libro de códigos 1502 que tiene el número u calculado en la fórmula (19).
19
Se genera un subvector reproducido mediante la fórmula (20)
20
en la que el j-ésimo elemento del i-ésimo subvector reproducido es resi(j).
A continuación, se describe con detalle la estructura de la unidad de normalización inversa 107 que forma parte del aparato de decodificación de señales de audio B2, en relación con la Figura 1 y la Figura 27. En la Figura 27, el número de referencia 1201 designa una unidad de normalización inversa de perfil de frecuencias, 1202 designa una unidad de normalización inversa de amplitud de banda y 1203 designa una tabla de bandas. La unidad de normalización inversa de perfil de frecuencias 1201 recibe los índices de la unidad de normalización de perfil de frecuencias 1201, reproduce el perfil de frecuencias y multiplica la salida de la unidad de cuantificación inversa 106 por el perfil de frecuencias. La unidad de normalización inversa de amplitud de banda 1202 recibe los índices de la unidad de normalización de amplitud de banda 202 y restaura la amplitud de cada banda mostrada en la tabla de bandas 1203, mediante multiplicación. Suponiendo que el valor de cada banda restaurada mediante los índices de la unidad de normalización de amplitud de banda B202 es qavej, el funcionamiento de la unidad de normalización inversa de amplitud de banda 1202 viene proporcionado por la fórmula (12)
21
en la que la salida de la unidad de normalización inversa de perfil de frecuencias 1201 es n_dct(i) y la salida de la unidad de normalización inversa de amplitud de banda 1202 es dct(i). Además, la tabla de bandas 1203 y la tabla de bandas 203 son idénticas.
A continuación, se describe con detalle la estructura de la unidad de normalización inversa de perfil de frecuencias 1201 que forma parte del aparato de decodificación de señales de audio 2, en relación con la Figura 28. En la Figura 28, el número de referencia 1301 designa una unidad de cuantificación inversa de perfil y 1302 designa una unidad de cuantificación inversa de características de envolvente. La unidad de cuantificación inversa de perfil 1301 restaura los parámetros que presentan el perfil de frecuencias (por ejemplo, los coeficientes de predicción lineal), utilizando los índices de la unidad de cuantificación de perfil 301 en el aparato de codificación. Cuando los coeficientes restaurados son coeficientes de predicción lineal, las características de envolvente cuantificadas se restauran mediante un cálculo similar con la fórmula (8). Cuando los coeficientes restaurados no son coeficientes de predicción lineal (por ejemplo, cuando son coeficientes LSP), las características de envolvente se restauran efectuando su transformación en características de frecuencia. La unidad de cuantificación inversa de características de envolvente 1302 multiplica las características de envolvente restauradas por la salida de la unidad de cuantificación inversa 106 de la forma mostrada en la fórmula (13), proporcionando el siguiente resultado:
22

Claims (36)

1. Procedimiento de codificación de señales de audio para codificar una cantidad de datos mediante cuantificación vectorial, utilizando un método de cuantificación de varias etapas que comprende un primer método de cuantificación vectorial para efectuar la cuantificación vectorial de una secuencia de señales de característica de frecuencia que se obtiene mediante la transformación de la frecuencia de la señal de audio de entrada, y un segundo método de cuantificación vectorial para efectuar la cuantificación vectorial del componente de error de cuantificación del primer método de cuantificación vectorial;
en el que, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, se selecciona uno de los bloques de frecuencias del componente de error de cuantificación del primer método de cuantificación vectorial que tiene gran importancia para la cuantificación y, en el segundo método de cuantificación vectorial, se cuantifica el componente de error de cuantificación del primer método de cuantificación respecto del bloque de frecuencias seleccionado.
2. Procedimiento de codificación de señales de audio para codificar una cantidad de datos mediante cuantificación vectorial, utilizando un método de cuantificación de varias etapas que comprende un método de cuantificación vectorial de primera etapa para efectuar la cuantificación vectorial de una secuencia de señales característica de frecuencia que se obtiene mediante la transformación de la frecuencia de la señal de audio de entrada, y métodos de cuantificación vectorial de segunda etapa y siguientes para efectuar la cuantificación vectorial del componente de error de cuantificación del método de cuantificación vectorial de la etapa anterior;
en el que, entre las diversas etapas de los métodos de cuantificación según el método de cuantificación de varias etapas, por lo menos un método de cuantificación vectorial lleva a cabo la cuantificación vectorial utilizando, como coeficientes de ponderación para la cuantificación, coeficientes de ponderación en frecuencia calculados basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos; y
basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, se selecciona uno de los bloques de frecuencias del componente de error del método de cuantificación vectorial de la primera etapa que tiene gran importancia para la cuantificación y, en el método de cuantificación vectorial de la segunda etapa, se cuantifica el componente de error de cuantificación del método de cuantificación de la primera etapa con respecto al bloque de frecuencias seleccionado.
3. Aparato de codificación de señales de audio, que comprende:
una unidad de transformación tiempo-frecuencia (103) para transformar una señal de audio de entrada en una señal del dominio de la frecuencia;
una unidad de cálculo de envolvente espectral para calcular la envolvente espectral de la señal de audio de entrada;
una unidad de normalización (104) para normalizar la señal del dominio de la frecuencia obtenida en la unidad de transformación tiempo-frecuencia (103) con la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y obtener, de ese modo, una señal residual;
una unidad de cálculo de ponderación auditiva (4006) para calcular coeficientes de ponderación en frecuencia, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos; y
una unidad de cuantificación de varias etapas (4005) que tiene diversas etapas de unidades de cuantificación vectorial conectadas en columnas, que recibe la señal residual normalizada y en la que por lo menos una de las unidades de cuantificación vectorial lleva a cabo la cuantificación utilizando los coeficientes de ponderación obtenidos en la unidad de ponderación.
4. Aparato de codificación de señales de audio según la reivindicación 3, en el que una pluralidad de unidades de cuantificación (40051, 40052 y 40053) de las diversas etapas de la unidad de cuantificación de varias etapas (4005) lleva a cabo la cuantificación utilizando los coeficientes de ponderación obtenidos en la unidad de ponderación (4006), y dicha unidad de cálculo de ponderación auditiva (4006) calcula los coeficientes de ponderación individuales que van a ser utilizados en las diversas etapas de las unidades de cuantificación (4005), respectivamente.
5. Aparato de codificación de señales de audio según la reivindicación 4,
en el que dicha unidad de cuantificación de varias etapas (4005) comprende:
una unidad de cuantificación de primera etapa para cuantificar la señal residual normalizada por la unidad de normalización, utilizando la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral como coeficientes de ponderación en los respectivos dominios de frecuencia;
una unidad de cuantificación de segunda etapa para cuantificar una señal de error de cuantificación de la unidad de cuantificación de primera etapa, utilizando los coeficientes de ponderación calculados basándose en la correlación entre la envolvente espectral y la señal de error de cuantificación de la unidad de cuantificación de la primera etapa, como coeficientes de ponderación en los respectivos dominios de frecuencia y
una unidad de cuantificación de la tercera etapa para cuantificar una señal de error de cuantificación de la unidad de cuantificación de segunda etapa, utilizando como coeficientes de ponderación en los respectivos dominios de frecuencia los coeficientes de ponderación obtenidos ajustando los coeficientes de ponderación calculados por la unidad de cálculo de ponderación auditiva (4006), según la señal de entrada transformada en una señal del dominio de la frecuencia por la unidad de transformación tiempo-frecuencia (103) y la característica auditiva, basándose en la envolvente espectral, la señal de error de cuantificación de la unidad de cuantificación de segunda etapa y la señal residual normalizada por la unidad de normalización.
6. Aparato de codificación de señales de audio, que comprende:
una unidad de transformación tiempo-frecuencia (103) para transformar una señal de audio de entrada en una señal del dominio de la frecuencia;
una unidad de cálculo de envolvente espectral para calcular la envolvente espectral de la señal de audio de entrada;
una unidad de normalización (104) para normalizar la señal de dominio de la frecuencia obtenida en la unidad de transformación tiempo-frecuencia (103), con la envolvente espectral obtenida en la unidad de cálculo de envolvente espectral para obtener, de ese modo, una señal residual;
un primer cuantificador de vectores para cuantificar la señal residual normalizada por la unidad de normalización (104);
medios de selección auditiva para seleccionar uno de los bloques de frecuencias del componente de error de cuantificación del primer cuantificador de vectores que tiene gran importancia para la cuantificación, basándose en el espectro de la señal de audio de entrada y la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, y
un segundo cuantificador para cuantificar el componente de error de cuantificación del primer cuantificador de vectores con respecto al bloque de frecuencias seleccionado por los medios de selección auditiva.
7. Aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica de límite audible mínimo.
8. Aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica de límite audible mínimo.
9. Aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica obtenida sumando la característica de límite audible mínimo y la característica de enmascaramiento calculada a partir de la señal de entrada.
10. Aparato de codificación de señales de audio según la reivindicación 6, en el que dichos medios de selección auditiva seleccionan un bloque de frecuencias utilizando, como escala de importancia para cuantificar, un valor obtenido multiplicando el componente de error de cuantificación del primer cuantificador de vectores, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la característica inversa de la característica obtenida sumando la característica de límite audible mínimo y la característica de enmascaramiento que se calcula a partir de la señal de entrada y se corrige de conformidad con la señal residual normalizada por la unidad de normalización, la señal de envolvente espectral obtenida en la unidad de cálculo de envolvente espectral y la señal de error de cuantificación de la unidad de cuantificación de primera etapa.
11. Aparato de codificación de señales de audio para codificar una cantidad de datos mediante cuantificación vectorial, utilizando medios de cuantificación de varias etapas (4005) que comprenden un primer cuantificador de vectores para efectuar la cuantificación vectorial de una señal de característica de frecuencia obtenida mediante la transformación de la frecuencia de una señal de audio de entrada, y un segundo cuantificador de vectores para efectuar la cuantificación vectorial del componente de error de cuantificación del primer cuantificador de vectores,
en el que dichos medios de cuantificación de varias etapas (4005) dividen la secuencia de señales de característica de frecuencia en cadenas de coeficientes correspondientes a por lo menos dos bandas de frecuencias, y cada uno de los cuantificadores de vectores lleva a cabo la cuantificación, de forma independiente, utilizando una pluralidad de cuantificadores de vectores divididos que se preparan adecuadamente para las respectivas cadenas de coeficientes.
12. Aparato de codificación de señales de audio según la reivindicación 11, que comprende además medios de normalización para normalizar la secuencia de señales de característica de frecuencia.
13. Aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación seleccionan de forma adecuada una de las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar que tiene una suma aditiva de energía elevada del error de cuantificación, y a continuación cuantifican la banda seleccionada.
14. Aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación seleccionan de forma adecuada una de las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar, basándose en la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, teniendo dicha banda de frecuencias una suma aditiva de energía elevada del error de cuantificación, que se pondera asignando valores altos a las bandas cuya característica de sensibilidad auditiva tiene gran importancia, y a continuación los medios de cuantificación cuantifican la banda seleccionada.
15. Aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación tienen un cuantificador de vectores que funciona como una unidad de cuantificación de banda completa que cuantifica, por lo menos una vez, todas las bandas de frecuencias de la secuencia de señales de característica de frecuencia que se van a cuantificar.
16. Aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación se construyen de tal forma que el cuantificador de vectores de primera etapa calcula el error de cuantificación de la cuantificación vectorial utilizando un método de cuantificación vectorial con un libro de códigos y, además, el cuantificador de vectores de segunda etapa efectúa la cuantificación vectorial del error de cuantificación calculado.
17. Aparato de codificación de señales de audio según la reivindicación 16, en el que, como método de cuantificación vectorial, se utilizan vectores de código (todos o parte de los cuales están invertidos) para la recuperación de códigos.
18. Aparato de codificación de señales de audio según la reivindicación 16, que comprende además medios de normalización para normalizar la secuencia de señales de característica de frecuencia, en el que el cálculo de las distancias utilizadas para la recuperación de un código óptimo en la cuantificación vectorial se lleva a cabo calculando las distancias mediante ponderaciones constituidas por los componentes normalizados de la señal de entrada procesados en la unidad de normalización y extrayendo el código que tiene una distancia mínima.
19. Aparato de codificación de señales de audio según la reivindicación 18, en el que las distancias se calculan mediante ponderaciones constituidas tanto por los componentes normalizados de la secuencia de señales de característica de frecuencia procesadas por los medios de normalización como por un valor que tiene en cuenta la característica de sensibilidad auditiva que muestra la capacidad auditiva de los seres humanos, y en el que se extrae el código que tiene la mínima distancia.
20. Aparato de codificación de señales de audio según la reivindicación 12, en el que dichos medios de normalización tienen una unidad de normalización de perfil de frecuencias que normaliza de forma aproximada el perfil de la secuencia de señales de característica de frecuencia.
21. Aparato de codificación de señales de audio según la reivindicación 12, en el que dichos medios de normalización tienen una unidad de normalización de amplitud de banda que divide la secuencia de señales de característica de frecuencia en una pluralidad de componentes de bandas unitarias continuas, y normalizan la secuencia de señales dividiendo cada banda unitaria con un solo valor.
22. Aparato de codificación de señales de audio según la reivindicación 11, en el que dichos medios de cuantificación incluyen un cuantificador de vectores para cuantificar las respectivas cadenas de coeficientes de la secuencia de señales de característica de frecuencia de forma independiente mediante cuantificadores de vectores divididos, e incluyen un cuantificador de vectores que funciona como una unidad de cuantificación de banda completa que cuantifica, por lo menos una vez, todas las bandas de frecuencia de la señal de entrada que se va a cuantificar.
23. Aparato de codificación de señales de audio según la reivindicación 22,
en el que dichos medios de cuantificación comprenden un primer cuantificador de vectores que comprende un cuantificador de vectores divididos de banda baja, un cuantificador de vectores divididos de banda intermedia y un cuantificador de vectores divididos de banda alta, un segundo cuantificador de vectores conectado después del primer cuantificador, y un tercer cuantificador de vectores conectado después del segundo cuantificador;
la secuencia de señales de característica de frecuencia introducida en los medios de cuantificación se divide en tres bandas, y la secuencia de señales de característica de frecuencia del componente de banda baja de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda baja, la secuencia de señales de característica de frecuencia del componente de banda intermedia de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda intermedia y la secuencia de señales de característica de frecuencia del componente de banda alta de entre las tres bandas es cuantificada por el cuantificador de vectores divididos de banda alta, de forma independiente;
el error de cuantificación con respecto a la secuencia de señales de característica de frecuencia se calcula en cada uno de los cuantificadores de vectores divididos que constituyen el primer cuantificador de vectores y el error de cuantificación se introduce en el subsiguiente segundo cuantificador de vectores;
el segundo cuantificador de vectores efectúa la cuantificación para el ancho de banda que va a ser cuantificado por el segundo cuantificador de vectores, calcula el error de cuantificación con respecto a la entrada del segundo cuantificador de vectores y lo proporciona al tercer cuantificador de vectores; y
el tercer cuantificador de vectores efectúa la cuantificación para el ancho de banda que va a ser cuantificado por el tercer cuantificador de vectores.
24. Aparato de codificación de señales de audio según la reivindicación 23, que comprende además una primera unidad de selección de banda de cuantificación entre el primer cuantificador de vectores y el segundo cuantificador de vectores, y una segunda unidad de selección de banda de cuantificación entre el segundo cuantificador de vectores y el tercer cuantificador de vectores;
en el que la salida del primer cuantificador de vectores se introduce en la primera unidad de selección de banda de cuantificación, y se selecciona la banda que va a ser cuantificada por el segundo cuantificador de vectores en la primera unidad de selección de banda de cuantificación;
el segundo cuantificador de vectores lleva a cabo la cuantificación para el ancho de banda que va a ser cuantificado por el segundo cuantificador de vectores, con respecto a los errores de cuantificación de los tres primeros cuantificadores de error seleccionados por la primera unidad de selección de banda de cuantificación, calcula el error de cuantificación con respecto a la entrada del segundo cuantificador de vectores y lo proporciona a la segunda unidad de selección de banda de cuantificación;
la segunda unidad de selección de banda de cuantificación selecciona la banda que va a ser cuantificada por el tercer cuantificador de vectores; y
el tercer cuantificador de vectores efectúa la cuantificación para la banda seleccionada por la segunda unidad de selección de banda de cuantificación.
25. Aparato de codificación de señales de audio según la reivindicación 23, en el que, en lugar del primer cuantificador de vectores, se construye el segundo cuantificador de vectores o el tercer cuantificador de vectores utilizando el cuantificador de vectores divididos de banda baja, el cuantificador de vectores divididos de banda intermedia y el cuantificador de vectores divididos de banda alta.
26. Aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 11, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende:
una unidad de cuantificación inversa para efectuar la cuantificación inversa utilizando, por lo menos, una parte de los códigos proporcionados por los medios de cuantificación del aparato de codificación de señales de audio; y
una unidad de transformación de frecuencia inversa para transformar una secuencia de señales de característica de frecuencia proporcionada por la unidad de cuantificación inversa en una señal correspondiente a la señal de audio de entrada original.
27. Aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 13, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende;
una unidad de cuantificación inversa para reproducir una secuencia de señales de característica de frecuencia;
una unidad de normalización inversa para reproducir los componentes normalizados basándose en los códigos proporcionados por el aparato de codificación de señales de audio, utilizando la secuencia de señales de característica de frecuencia proporcionada por la unidad de cuantificación inversa y multiplicando la secuencia de señales de característica de frecuencia y los componentes normalizados; y
\newpage
una unidad de transformación de frecuencia inversa para recibir la salida de la unidad de normalización inversa y transformar la secuencia de señales de característica de frecuencia en una señal correspondiente a la señal de audio original.
28. Aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 22, decodifica estos códigos para generar una señal correspondiente a la señal de audio original y comprende:
una unidad de cuantificación inversa que efectúa la cuantificación inversa utilizando los códigos obtenidos, ya sea de todos los cuantificadores de vectores que constituyen los medios de cuantificación del aparato de codificación de señales de audio o bien de algunos de ellos.
29. Aparato de decodificación de señales de audio según la reivindicación 28, en el que:
dicha unidad de cuantificación inversa efectúa la cuantificación inversa de los códigos cuantificados en una banda establecida ejecutando, de forma alternada, la cuantificación inversa de los códigos cuantificados en la siguiente etapa y la cuantificación inversa de los códigos cuantificados en una banda diferente de la establecida;
cuando no hay ningún código cuantificado en la siguiente etapa durante la cuantificación inversa, la unidad de cuantificación inversa ejecuta de forma continuada la cuantificación inversa de los códigos cuantificados en la banda diferente; y
cuando no hay ningún código cuantificado en la banda diferente, la unidad de cuantificación inversa ejecuta de forma continuada la cuantificación inversa de los códigos cuantificados en la siguiente etapa.
30. Aparato de decodificación de señales de audio que recibe como entrada los códigos proporcionados por el aparato de codificación de señales de audio según la reivindicación 23, decodifica estos códigos para generar una señal correspondiente a la señal de audio de entrada original y comprende:
una unidad de cuantificación inversa que efectúa la cuantificación inversa utilizando sólo los códigos proporcionados por el cuantificador de vectores divididos de banda baja que forma parte del primer cuantificador de vectores, aun cuando todos o parte de los tres cuantificadores de vectores divididos que constituyen el primer cuantificador de vectores del aparato de codificación de señales de audio generen códigos.
31. Aparato de decodificación de señales de audio según la reivindicación 30, en el que dicha unidad de cuantificación inversa efectúa la cuantificación inversa utilizando códigos proporcionados por el segundo cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja que forma parte del primer cuantificador de vectores.
32. Aparato de decodificación de señales de audio según la reivindicación 31, en el que dicha unidad de cuantificación inversa lleva a cabo la cuantificación inversa utilizando códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, y los códigos proporcionados por el segundo cuantificador de vectores.
33. Aparato de decodificación de señales de audio según la reivindicación 32, en el que dicha unidad de cuantificación inversa lleva a cabo la cuantificación inversa utilizando los códigos proporcionados por el tercer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, los códigos proporcionados por el segundo cuantificador de vectores y los códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores.
34. Aparato de decodificación de señales de audio según la reivindicación 33, en el que dicha unidad de cuantificación inversa efectúa la cuantificación inversa utilizando códigos proporcionados por el cuantificador de vectores divididos de banda alta, que forma parte del primer cuantificador de vectores, además de los códigos proporcionados por el cuantificador de vectores divididos de banda baja, que forma parte del primer cuantificador de vectores, los códigos proporcionados por el segundo cuantificador de vectores, los códigos proporcionados por el cuantificador de vectores divididos de banda intermedia, que forma parte del primer cuantificador de vectores, y los códigos proporcionados por el tercer cuantificador de vectores.
35. Procedimiento de codificación y decodificación de señales de audio que recibe una secuencia de señales de característica de frecuencia obtenida mediante la transformación de la frecuencia de una señal de audio de entrada, codifica y proporciona la señal codificada y decodifica la señal codificada de salida para reproducir una señal correspondiente a la señal de audio de entrada original:
en el que la secuencia de señales de característica de frecuencia se divide en cadenas de coeficientes correspondientes a por lo menos dos bandas de frecuencia, y estas cadenas de coeficientes se cuantifican y proporcionan de forma independiente; y
a partir de la señal cuantificada recibida, se efectúa la cuantificación inversa de los datos de una banda arbitraria correspondiente a la banda dividida para reproducir, de ese modo, una señal correspondiente a la señal de audio de entrada original,
en el que dicha cuantificación se lleva a cabo en etapas y, a continuación, el error de cuantificación calculado es sometido a una mayor cuantificación; y
dicha cuantificación inversa se efectúa repitiendo, de forma alternada, una cuantificación destinada a ampliar la banda y una cuantificación destinada a intensificar las etapas de cuantificación en la cuantificación.
36. Procedimiento de codificación y decodificación de señales de audio según la reivindicación 35, en el que dicha cuantificación inversa destinada a ampliar la banda se efectúa por orden según la característica psicológica auditiva de los seres humanos.
ES97928529T 1996-07-01 1997-07-01 Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. Expired - Lifetime ES2205238T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP17129696 1996-07-01
JP17129696A JP3246715B2 (ja) 1996-07-01 1996-07-01 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP9240697 1997-04-10
JP9240697 1997-04-10
JP12584497 1997-05-15
JP12584497 1997-05-15

Publications (1)

Publication Number Publication Date
ES2205238T3 true ES2205238T3 (es) 2004-05-01

Family

ID=27307035

Family Applications (1)

Application Number Title Priority Date Filing Date
ES97928529T Expired - Lifetime ES2205238T3 (es) 1996-07-01 1997-07-01 Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio.

Country Status (8)

Country Link
US (1) US6826526B1 (es)
EP (1) EP0910067B1 (es)
JP (1) JP3246715B2 (es)
KR (1) KR100283547B1 (es)
CN (1) CN1156822C (es)
DE (1) DE69724126T2 (es)
ES (1) ES2205238T3 (es)
WO (1) WO1998000837A1 (es)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
KR100363259B1 (ko) * 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
GB2396538B (en) * 2000-05-16 2004-11-03 Samsung Electronics Co Ltd An apparatus and method for quantizing phase of speech signal using perceptual weighting function
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
EP1343143B1 (en) * 2000-12-14 2011-10-05 Sony Corporation Analysis-synthesis of audio signal
JP4300800B2 (ja) 2000-12-22 2009-07-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
DE10102159C2 (de) 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE60204038T2 (de) * 2001-11-02 2006-01-19 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zum codieren bzw. decodieren eines audiosignals
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
JP4609097B2 (ja) * 2005-02-08 2011-01-12 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
TWI324336B (en) 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
CN100370834C (zh) * 2005-08-08 2008-02-20 北京中星微电子有限公司 多模图像编解码芯片中的系数缩放计算模块
KR20080047443A (ko) * 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JPWO2008047795A1 (ja) * 2006-10-17 2010-02-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8886612B2 (en) * 2007-10-04 2014-11-11 Core Wireless Licensing S.A.R.L. Method, apparatus and computer program product for providing improved data compression
US8306817B2 (en) * 2008-01-08 2012-11-06 Microsoft Corporation Speech recognition with non-linear noise reduction on Mel-frequency cepstra
JP5262171B2 (ja) * 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
US9031243B2 (en) * 2009-09-28 2015-05-12 iZotope, Inc. Automatic labeling and control of audio algorithms by audio recognition
US20110145325A1 (en) * 2009-12-16 2011-06-16 Alcatel-Lucent Usa Inc. Running an interactive multi-user application at a mobile terminal
US20110145341A1 (en) * 2009-12-16 2011-06-16 Alcatel-Lucent Usa Inc. Server platform to support interactive multi-user applications for mobile clients
US8654859B1 (en) 2009-12-17 2014-02-18 Ambarella, Inc. Low cost rate-distortion computations for video compression
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method
KR101850724B1 (ko) * 2010-08-24 2018-04-23 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN103081007A (zh) * 2010-09-17 2013-05-01 松下电器产业株式会社 量化装置及量化方法
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5648123B2 (ja) 2011-04-20 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、およびこれらの方法
WO2013035257A1 (ja) * 2011-09-09 2013-03-14 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP6407150B2 (ja) * 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
KR102132522B1 (ko) * 2014-02-27 2020-07-09 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치
EP2919232A1 (en) 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
SG10201808285UA (en) 2014-03-28 2018-10-30 Samsung Electronics Co Ltd Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
CN112927703A (zh) 2014-05-07 2021-06-08 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置
GB2538315A (en) * 2015-05-15 2016-11-16 Horseware Products Ltd A closure system for the front end of a horse rug
JP6475273B2 (ja) * 2017-02-16 2019-02-27 ノキア テクノロジーズ オーユー ベクトル量子化
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN113302688A (zh) * 2019-01-13 2021-08-24 华为技术有限公司 高分辨率音频编解码
KR20210133554A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03228433A (ja) 1990-02-02 1991-10-09 Fujitsu Ltd 多段ベクトル量子化方式
JP3114197B2 (ja) 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JPH0815261B2 (ja) 1991-06-06 1996-02-14 松下電器産業株式会社 適応変換ベクトル量子化符号化法
JP3088163B2 (ja) 1991-12-18 2000-09-18 沖電気工業株式会社 Lsp係数の量子化方法
JPH05257498A (ja) * 1992-03-11 1993-10-08 Mitsubishi Electric Corp 音声符号化方式
JPH0677840A (ja) 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JP3239488B2 (ja) 1992-11-30 2001-12-17 三菱電機株式会社 画像帯域分割符号化装置および画像帯域分割符号化方法
US5398069A (en) * 1993-03-26 1995-03-14 Scientific Atlanta Adaptive multi-stage vector quantization
CA2140779C (en) * 1993-05-31 2005-09-20 Kyoya Tsutsui Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal
JPH0764599A (ja) 1993-08-24 1995-03-10 Hitachi Ltd 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08137498A (ja) * 1994-11-04 1996-05-31 Matsushita Electric Ind Co Ltd 音声符号化装置
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
JP3537008B2 (ja) 1995-07-17 2004-06-14 株式会社日立国際電気 音声符号化通信方式とその送受信装置
JPH09127987A (ja) 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP3159012B2 (ja) * 1995-10-26 2001-04-23 日本ビクター株式会社 音響信号の符号化装置及び復号化装置
JPH09281995A (ja) 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US5809459A (en) * 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置

Also Published As

Publication number Publication date
DE69724126D1 (de) 2003-09-18
EP0910067B1 (en) 2003-08-13
WO1998000837A1 (fr) 1998-01-08
JP3246715B2 (ja) 2002-01-15
DE69724126T2 (de) 2004-06-09
JPH1020898A (ja) 1998-01-23
KR100283547B1 (ko) 2001-04-02
KR20000010994A (ko) 2000-02-25
EP0910067A4 (en) 2000-07-12
EP0910067A1 (en) 1999-04-21
US6826526B1 (en) 2004-11-30
CN1222997A (zh) 1999-07-14
CN1156822C (zh) 2004-07-07

Similar Documents

Publication Publication Date Title
ES2205238T3 (es) Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio.
ES2216367T3 (es) Aparato de codificacion y de decodificacion de señales de audio.
US7243061B2 (en) Multistage inverse quantization having a plurality of frequency bands
EP2308045B1 (en) Compression of audio scale-factors by two-dimensional transformation
ES2717606T3 (es) Codificación y decodificación de audio escalable usando un banco de filtros jerárquico
KR100958144B1 (ko) 오디오 압축
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JPH09127990A (ja) 音声符号化方法及び装置
KR101414359B1 (ko) 부호화 장치 및 부호화 방법
KR100309727B1 (ko) 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3237178B2 (ja) 符号化方法及び復号化方法
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP3698418B2 (ja) オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
EP0729132A2 (en) Wide band signal encoder
CN111788628A (zh) 编码装置、编码方法、程序以及记录介质
JP4327420B2 (ja) オーディオ信号符号化方法、及びオーディオ信号復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP4993992B2 (ja) 信号処理方法、信号処理装置及びプログラム
WO2018225412A1 (ja) 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
JPH041800A (ja) 音声帯域信号符号化方法
Najafzadeh-Azghandi Percept ual Coding of Narrowband Audio
JPH09127997A (ja) 音声符号化方法及び装置