ES2989615T3 - Aparato de codificación de señales de audio, aparato de decodificación de señales de audio, método de codificación de señales de audio y método de decodificación de señales de audio - Google Patents
Aparato de codificación de señales de audio, aparato de decodificación de señales de audio, método de codificación de señales de audio y método de decodificación de señales de audio Download PDFInfo
- Publication number
- ES2989615T3 ES2989615T3 ES20176535T ES20176535T ES2989615T3 ES 2989615 T3 ES2989615 T3 ES 2989615T3 ES 20176535 T ES20176535 T ES 20176535T ES 20176535 T ES20176535 T ES 20176535T ES 2989615 T3 ES2989615 T3 ES 2989615T3
- Authority
- ES
- Spain
- Prior art keywords
- subband
- bits
- subbands
- audio signal
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un aparato de codificación de señales de audio (100) incluye un transformador de tiempo-frecuencia (101) que genera espectros de subbanda a partir de una señal de entrada, un cuantificador de energía de subbanda (102), un calculador de tonalidad (103) que analiza la tonalidad de los espectros de subbanda, un asignador de bits (104) que selecciona una segunda subbanda en la que se realiza la cuantificación mediante un segundo cuantificador (107) basándose en el resultado del análisis de la tonalidad y la energía de subbanda cuantificada, y determina un primer número de bits que se asignarán a una primera subbanda en la que se realiza la cuantificación mediante un primer cuantificador (106), siendo el primer cuantificador (106) el que realiza la codificación utilizando el primer número de bits, el segundo cuantificador (107) el que realiza la codificación utilizando un filtro de tono, y un multiplexor (108). (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Aparato de codificación de señales de audio, aparato de decodificación de señales de audio, método de codificación de señales de audio y método de decodificación de señales de audio
Campo de la invención
La presente divulgación se refiere a una técnica de codificación y a una técnica de decodificación para mejorar la calidad de audio de señales de audio, tal como señales de voz y señales de música.
Antecedentes de la técnica
Una técnica de codificación para comprimir señales de audio a una baja tasa de bits es una técnica esencial para llevar a cabo el uso efectivo de ondas de radio y así sucesivamente en comunicación móvil. Mientras tanto, ha habido recientemente un deseo cada vez mayor de mejorar la calidad de audio en comunicación telefónica y se anticipa una implementación de servicios de comunicación por teléfono que produce una sensación mayor de presencia. Para implementar tales servicios, es necesario codificar señales de audio que tienen una banda de frecuencia amplia a una alta tasa de bits. No obstante, este enfoque entra en conflicto con el uso eficaz de las ondas de radio y las bandas de frecuencia.
Por ejemplo, ahora se estudia una técnica de codificación de señal de audio adoptada por la norma G.719 (NPL 1).
En la norma G.719, ante la codificación de una señal de audio, se realiza una transformada de frecuencia sobre la señal de audio, y los bits predeterminados se asignan a un espectro obtenido como resultado de la transformada de frecuencia. Específicamente, el espectro se divide en subbandas que tienen anchos de banda de frecuencia predeterminados, y una unidad (una unidad que tiene un número necesario de bits) utilizada en cuantificación basándose en la cuantificación del vector de malla se asigna a cada una de las subbandas en orden decreciente de energía, como sigue.
(1) Una unidad se asigna a una subbanda que tiene la energía más grande entre la totalidad de las subbandas.
Se asigna un bit por espectro. Por lo tanto, si el número de muestras espectrales en una subbanda es ocho, por ejemplo, una unidad contiene ocho bits (obsérvese que el número máximo de bits que se pueden asignar por espectro son nueve bits, y por lo tanto, si el número de muestras espectrales en una subtrama es ocho, se pueden asignar hasta 72 bits).
(2) La energía de subbanda cuantificada de la subbanda a la cual se ha asignado una unidad se disminuye en dos niveles (6 dB). Si el número de bits asignados a la subbanda a la cual se ha asignado una unidad que supera el valor máximo (nueve bits), la subbanda se excluye de la cuantificación en los bucles sucesivos.
(3) De regreso a (1) anterior, se repite el mismo proceso.
La figura 6 ilustra la energía de subbanda de cada subbanda. El eje horizontal representa la frecuencia y el eje vertical representa la amplitud en una escala logarítmica. En la figura, la energía de la subbanda de cada subbanda se representa por una línea horizontal en lugar de un punto. La longitud de cada línea horizontal representa el ancho de banda de frecuencia de cada subbanda.
La figura 7 y la figura 8 son diagramas que ilustran ejemplos de los resultados de asignación de bits a cada subbanda en un caso de uso de un método de codificación especificado en la norma G.719. En las figuras, el eje horizontal representa la frecuencia y el eje vertical representa el número asignado de bits. La figura 7 ilustra un caso de una tasa de bits de 128 kbit/s, y la figura 8 ilustra un caso de una tasa de bits de 64 kbit/s.
En el caso de 128 kbit/s, está disponible para asignación un presupuesto de bits abundante y por lo tanto pueden asignarse nueve bits, que es el valor máximo, a una gran cantidad de subbandas (espectro) y puede mantenerse la calidad de señales de audio a un alto nivel.
En contraste, en el caso de 64 kbit/s, a ninguna subbanda se le asignan nueve bits, que es el valor máximo, sino que a cada subbanda se le asignan algunos bits. En consecuencia, se considera que esta degradación en la calidad de las señales de audio se puede suprimir y se puede llevar a cabo un uso eficaz de las ondas de radio y las bandas de frecuencia.
Lista de citas
Bibliografía de patente
PTL 1: Publicación de solicitud de patente no examinada Japonesa (traducción de la solicitud PCT) N° 2013- 534328
PTL 2: Publicación internacional N.° 2005/027095
Bibliografía no de patente
NPL 1: ITU-T norma G.719, 2008
El documento US 5870703 A describe una aplicación, en la que una señal de entrada de uno de varios canales se convierte mediante un circuito de conversión en componentes de frecuencia que se separan en componentes tonales y componentes de ruido en un circuito de separación de comentarios de señal. Los componentes tonales y los componentes de señal se codifican por un circuito de codificación de componentes tonales y un circuito de codificación de componentes de ruido, respectivamente. La cantidad de bytes asignados a los componentes de ruido en los respectivos canales se determina por un circuito de asignación de bytes basado en cambios de tiempo de la suma de los factores de escala de los respectivos canales.
Sumario de la invención
No obstante, el uso eficaz de ondas de radio y bandas de frecuencia necesita fomentarse adicionalmente. En este punto, en un caso de codificación de una señal de audio que tiene una frecuencia de muestreo de aproximadamente 32 kHz a una tasa de bits baja 20 kpbs/s o menos mediante la utilización del método anteriormente descrito adoptado por la norma G.719, no es posible reservar una unidad (un número de bits) utilizados en la cuantificación de todas las subbandas, lo cual es un problema.
La figura 9 es un diagrama que ilustra un ejemplo del resultado de asignación de bits a cada subbanda en un caso de uso del método de codificación especificado en la norma G.719 a 20 kbit/s. Como se ilustra, la asignación de bits falla no solo en un intervalo de alta frecuencia sino también, dependiendo de la situación, en un intervalo de baja frecuencia, lo cual es esencial para escuchar. En consecuencia, no es posible la codificación de espectros en las subbandas correspondientes, lo que da como resultado degradación significativa en la calidad de las señales de audio.
Para resolver dicho problema, se puede emplear un método para cambiar dinámicamente un método de asignación de bits (PTL 1).
No obstante, el método de asignación de bits se cambia mientras se utiliza un método de codificación único (método de cuantificación) sin cambiar el método de codificación (método de cuantificación), y por lo tanto, este enfoque a la degradación en la calidad de las señales de audio tiene un efecto limitado.
La presente divulgación proporciona una técnica de codificación y una técnica de decodificación para realizar señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
De acuerdo con la invención, se proporciona un aparato como se indica en la reivindicación 1, un aparato como se indica en la reivindicación 9, un método como se indica en la reivindicación 12, un método como se indica en la reivindicación 13 y un programa informático como se indica en la reivindicación 14. Las realizaciones preferidas se indican en las reivindicaciones dependientes.
Obsérvese que las realizaciones generales o específicas se pueden implementar como un sistema, un método, un circuito integrado o un programa informático o cualquier combinación selectiva de un sistema, un aparato, un método, un circuito integrado y un programa informático.
Con el aparato de codificación, el aparato de decodificación y así sucesivamente, de acuerdo con la presente divulgación, es posible codificar y decodificar señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
Breve descripción de los dibujos
[Fig. 1] La figura 1 es un diagrama de bloques de un aparato de codificación de acuerdo con una primera realización de la presente divulgación.
[Fig. 2] La figura 2 es un diagrama de bloques detallado de un asignador de bits del aparato de codificación de acuerdo con la primera realización de la presente divulgación.
[Fig. 3] La figura 3 es un diagrama para describir una operación realizada por el aparato de codificación de acuerdo con la primera realización de la presente divulgación.
[Fig. 4] La figura 4 es un diagrama de bloques de un aparato de decodificación de acuerdo con una segunda realización de la presente divulgación.
[Fig. 5] La figura 5 es un diagrama de bloques detallado de un asignador de bits del aparato de decodificación de acuerdo con la segunda realización de la presente divulgación.
[Fig. 6] La figura 6 es un diagrama para describir la energía de subbanda en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 7] La figura 7 es un diagrama para describir el resultado de asignación de bits a subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 8] La figura 8 es un diagrama para describir el resultado de asignación de bits a subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 9] La figura 9 es un diagrama para describir el resultado de asignación de bits a subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
Descripción de las realizaciones
En lo sucesivo se describirán configuraciones y operaciones de realizaciones de la presente divulgación con referencia a los dibujos. Las señales de audio, las cuales son señales de entrada a un aparato de codificación de la presente divulgación y señales de salida desde un aparato de decodificación de la presente divulgación, incluyen conceptualmente señales de voz, señales de música que tienen una banda más amplia y señales en las cuales estos tipos de señales se mezclan.
En la presente divulgación, las “señales de audio de entrada” incluyen conceptualmente señales de música, señales de voz y señales en las cuales se mezclan ambos tipos de señales. El término “energía de subbanda cuantificada” significa energía obtenida cuantificando energía de una subbanda, la cual es la suma o promedio de la energía de los espectros de subbanda en una subbanda, y la energía de una subbanda se puede obtener al calcular el cuadrado de la suma de los espectros de subbanda en la subbanda, por ejemplo. El término “tonalidad” significa el grado en el cual se produce el pico espectral en un componente de frecuencia específico y el resultado de análisis de la tonalidad se puede representar por un valor numérico, una codificación o similar. El término “codificación de pulso” significa codificación en la cual el espectro está representado aproximadamente utilizando pulsos.
La expresión “relativamente bajo” significa un caso que es menor como resultado de una comprensión entre subbandas y corresponde a un caso que es menor que el promedio de todas las subbandas o un caso que es menor que un valor predeterminado. La expresión “subbanda en un intervalo de frecuencia alto” significa una subbanda que está colocada más cercana a un lado de alta frecuencia entre una pluralidad de subbandas.
Obsérvese que un primer cuantificador (espectro), un segundo cuantificador (espectro), un primer decodificador (espectro), un segundo decodificador (espectro), una primera subbanda, una segunda subbanda, una tercera subbanda, una cuarta subbanda, un primer número de bits, un segundo número de bits, un tercer número de bits y un cuarto número de bits descritos en las realizaciones y en las reivindicaciones se distinguen entre sí para representar no el orden de los mismos sino sus categorías.
(Primera realización)
La figura 1 es un diagrama de bloques que ilustra una configuración y una operación de un aparato de codificación de señal de audio 100 de acuerdo con una primera realización. El aparato de codificación de señal de audio 100 ilustrado en la figura 1 incluye un transformador de tiempo-frecuencia 101, un cuantificador de energía de subbanda 102, un calculador de tonalidad 103, un asignador de bits 104, un normalizador 105, un primer cuantificador de espectro 106, un segundo cuantificador de espectro 107 y un multiplexor 108. Al multiplexor 108 está conectada una antena A. El aparato de codificación de señal de audio 100 y la antena A juntos constituyen un aparato terminal o un aparato de estación de base.
El transformador de tiempo-frecuencia 101 realiza una transformada sobre una señal de audio de entrada en un dominio de tiempo en un dominio de frecuencia y genera un espectro de señal de audio de entrada (a continuación denominado como “espectro”). La transformada tiempo frecuencia se realiza utilizando MDCT (transformada de coseno discreta modificada), por ejemplo, pero no está limitada a esta transformada. La transformada de tiempofrecuencia se puede realizar utilizando DCT (transformada de coseno discreta), DFT (transformada de Fourier discreta) o transformada de Fourier, por ejemplo.
El transformador de tiempo-frecuencia 101 divide el espectro en subbandas que son bandas de frecuencia predeterminadas. Las bandas de frecuencia predeterminadas pueden estar separadas en intervalos iguales o pueden estar separadas en intervalos diferentes, específicamente, en intervalos largos en un intervalo de alta frecuencia y en intervalos cortos en un intervalo de baja frecuencia, por ejemplo.
El transformador de tiempo-frecuencia 101 emite espectros obtenidos por división en las subbandas al cuantificador de energía de subbanda 102, al calculador de tonalidad 103 y al normalizador 105 como espectros de subbanda.
El cuantificador de energía de subbanda 102 obtiene, para cada subbanda, energía de subbanda, que es energía del espectro de subbanda, cuantifica la energía de subbanda y obtiene la energía de subbanda cuantificada. Específicamente, la energía de subbanda se puede obtener al calcular la suma cuadrada de los espectros de subbanda en la subbanda; no obstante, el cálculo no se limita a esto. La energía de subbanda se puede obtener al realizar integración de las amplitudes de espectros de subbanda para cada subbanda, por ejemplo. En un caso de promediado de la energía de subbanda, la suma cuadrada se divide entre el número de espectros (anchura de subbanda) en la subbanda. La energía de subbanda obtenida de esta manera se cuantifica de acuerdo con una anchura de paso predeterminada.
El cuantificador de energía de subbanda 102 emite la energía de subbanda cuantificada obtenida al normalizador 105 y al asignador de bits 104 y emite la energía de subbanda cuantificada codificada obtenida por codificación de la energía de subbanda cuantificada al multiplexor 108.
El calculador de tonalidad 103 analiza los espectros de subbanda incluidos en cada subbanda y determina la tonalidad de la subbanda. La tonalidad es el grado al cual se produce el pico espectral en un componente de frecuencia específico e incluye conceptualmente la presentación de picos, lo que significa que está presente un pico perceptible. La tonalidad se puede obtener cuantitativamente al calcular la relación entre la amplitud del espectro promedio en una subbanda objetivo y la amplitud del espectro máximo presente en la subbanda, por ejemplo. Se define que los espectros de la subbanda tienen tonalidad (presentación de picos) si el valor obtenido supera un umbral predeterminado. En esta realización, el calculador de tonalidad 103 genera una bandera con picos/tonal establecida a uno si el valor obtenido supera del valor predeterminado o genera una bandera con picos/tonal establecida a cero si el valor obtenido es igual o menor que un umbral predeterminado y emite la bandera con picos/tonal al asignador de bits 104 y al multiplexor 108 como resultado de análisis. El calculador de tonalidad 103 puede transmitir como resultado de análisis la relación anteriormente descrita tal cual.
El calculador de tonalidad es eficaz como sigue.
Bajo una condición de baja velocidad de bits, para cuantificar eficazmente un espectro en el que la energía espectral se distribuye a través de una subbanda, tal como un espectro similar a ruido, es efectivo un método basado en un filtro de tono (esto es, un método en el que un espectro de intervalo de alta frecuencia se expresa utilizando un espectro de intervalo de baja frecuencia). Por lo tanto, el grado de distribución de energía dentro de una subbanda se determina a partir de la medida de la presentación de picos/tonalidad (la relación entre la potencia pico y la potencia promedio o similar) del espectro en la subbanda, y si la presentación de picos/tonalidad del espectro no es alta, la subbanda se somete a cuantificación basándose en un filtro de tono.
El asignador de bits 104 hace referencia a la energía de subbanda cuantificada y a la bandera con picos/tonal de cada subbanda y asigna bits a partir de un presupuesto de bits, el cual corresponde al número total de bits disponibles para codificación, al espectro de subbanda en cada subbanda. Específicamente, el asignador de bits 104 calcula y determina un primer número de bits, el cual es el número de bits que van a asignarse a las primeras subbandas, las cuales son subbandas en las que se realiza cuantificación por el primer cuantificador de espectro, y emite el resultado al primer cuantificador de espectro 106 como información de bits asignada. Además, el asignador de bits 104 selecciona e identifica segundas subbandas, que son subbandas en las que se realiza cuantificación por el segundo cuantificador de espectro 107, y emite el resultado al segundo cuantificador de espectro 107 como un modo de cuantificación.
La configuración y operación del asignador de bits 104 se describen en detalle a continuación.
Obsérvese que, en esta realización, el asignador de bits 104 hace referencia a la bandera con picos/tonal y la energía de subbanda cuantificada de cada subbanda en este orden; no obstante, el orden de referencia puede ser cualquier orden.
Con respecto a las segundas subbandas, las cuales se someten a cuantificación por el segundo cuantificador de espectro 107, las subbandas en la banda completa pueden ser segundas subbandas candidatas. En general, una banda que tiene una energía de subbanda cuantificada baja y una banda que tiene una tonalidad baja están presentes principalmente en un intervalo de alta frecuencia y por lo tanto únicamente las subbandas presentes en un intervalo de alta frecuencia específico pueden tenerse como objetivo. Por ejemplo, únicamente pueden tenerse como objetivo cuatro o cinco subbandas en un intervalo de alta frecuencia.
Una señal de audio normalmente tiene una tonalidad alta en un intervalo de baja frecuencia y una tonalidad baja en el intervalo de alta frecuencia y por lo tanto las subbandas en un intervalo de alta frecuencia se someten sustancialmente a cuantificación basándose en un filtro de tono. En consecuencia, se puede utilizar un método alternativo en el cual todas las subbandas, en un intervalo de frecuencia superior a una subbanda seleccionada basándose en la tonalidad se pueden someter a cuantificación basándose en un filtro de tono y únicamente los números de subbanda pueden transmitirse como el modo de cuantificación.
En normalizador 105 normaliza (divide) cada espectro de subbanda por la energía de subbanda cuantificada de entrada para generar un espectro de subbanda normalizado. Como resultado, se normaliza la diferencia en la magnitud de la amplitud entre las subbandas. El normalizador 105 emite el espectro de subbanda normalizado al primer cuantificador de espectro 106 y al segundo cuantificador de espectro 107.
Obsérvese que el normalizador 105 puede tener cualquier configuración.
Aunque el normalizador 105 está configurado como un componente en esta realización, el normalizador 105 se puede proporcionar en la etapa anterior del primer cuantificador de espectro 106 y en la etapa anterior del segundo cuantificador de espectro 107, esto es, se pueden configurar como dos componentes.
El primer cuantificador de espectro 106 es un ejemplo de un primer cuantificador y cuantifica espectros de subbanda que pertenecen a las primeras subbandas sobre las cuales se va a realizar cuantificación por el primer cuantificador de espectro 106 entre los espectros de subbanda normalizados de entrada mediante la utilización del primer número de bits asignados por el asignador de bits 104. El primer cuantificador de espectro 106 emite el resultado de cuantificación al segundo cuantificador de espectro 107 como espectros cuantificados y emite la primera información codificada obtenida por codificación de los espectros cuantificados al multiplexor 108.
El primer cuantificador de espectro 106 utiliza un codificador de pulsos. Los ejemplos del codificador de pulsos incluyen un cuantificador de vector de malla que realiza cuantificación de vector de malla y un codificador de pulsos que realiza codificación de pulsos en el cual un espectro de subbanda está representado aproximadamente por un número pequeño de pulsos. Esto es, cualquier cuantificador se puede utilizar en la medida en que el cuantificador emplee un método de cuantificación adecuado para cuantificación de un espectro que tenga una tonalidad alta o un método de cuantificación que utilice un número pequeño de pulsos.
Obsérvese que, a una tasa de bits extremadamente baja, se puede esperar un efecto superior de mantenimiento de calidad de audio con cuantificación utilizando codificación de pulso en la cual el espectro de subbanda está representado aproximadamente por un número pequeño de pulsos en comparación con la cuantificación de vector de malla.
El segundo cuantificador de espectro 107 es un ejemplo de un segundo cuantificador y puede emplear un método de cuantificación utilizando una banda extendida (modelo de predicción utilizando un filtro de tono) como se describe a continuación, por ejemplo.
En este punto, un filtro de tono es un bloque de procesamiento que realiza un procedimiento representado por la expresión 1 a continuación.
[Expresión matemática 1)
y[i] = x[i] S x y[¡ . T]
En general, un filtro de tono hace referencia a un filtro que enfatiza un ciclo de tono (T) para una señal en un eje de tiempo (enfatiza un componente de tono sobre un eje de frecuencia) y es, por ejemplo, un filtro digital representado por la expresión 1 para una señal discontinua x[i] si el número de derivaciones es uno. No obstante, un filtro de tono en esta realización se define como un bloque de procesamiento que realiza un procedimiento representado por la expresión 1 y no necesariamente realiza el tono enfatizado sobre una señal en el eje de tiempo.
En esta realización, el filtro de tono (bloque de procesamiento representado por la expresión 1) se aplica a una secuencia de coeficiente MDCT de cuantificación Mq[i]. Específicamente, la expresión 1, los ajustes, específicamente x[i] = 0 (i > K, donde K es el límite de frecuencia inferior del coeficiente MDCT que se somete a codificación) y se realiza y[i] = Mq[i] (i < K), y se calcula y[i](K < I < K’, donde K’ es el límite de frecuencia superior del coeficiente MDCT que se somete a codificación). Se codifica un valor T con el que se minimiza el error entre el coeficiente MDCT, Mt[i] que se somete a codificación y el valor y[i] calculado como información de retardo. Tal codificación de espectro basada en un filtro de tono se describe por PTL 2, por ejemplo.
El segundo cuantificador de espectro 107 hace referencia a un modo de cuantificación e identifica las segundas subbandas (espectros de subbandas normalizados) sobre las cuales se va a realizar la cuantificación por el segundo cuantificador de espectro 107. Como resultado, se identifican los valores de K y K’ anteriormente descritas. Después, la subbanda o la banda de un espectro cuantificado para el cual el espectro de subbanda normalizado (que corresponde a Mt[i] anteriormente descrito, donde K < i < K’) en relación a las segundas subbandas identificadas (una frecuencia que varía de K a K’) tiene la correlación máxima con un espectro cuantificado (que corresponde a Mq[i] anteriormente descrito, donde i < K) que es lo que se busca, y la posición de la subbanda o la banda se utiliza para generar información de retardo (que corresponde a T anteriormente descrita). Los ejemplos de la información de retardo incluyen la posición absoluta o la posición relativa de la subbanda o la banda, o el número de subbanda. El segundo cuantificador de espectro 107 codifica y emite la información de retardo al multiplexor 108 como segunda información codificada.
Obsérvese que, en esta realización, la energía de la subbanda cuantificada codificada se multiplexa y transmite por el multiplexor 108 y se puede generar una ganancia por un decodificador. Por lo tanto, una ganancia no está codificada. No obstante, una ganancia puede codificarse y transmitirse. En este caso, se calcula una ganancia entre las segundas subbandas sobre las cuales se va a realizar la cuantificación y la subbanda de un espectro cuantificado que tiene la correlación máxima y el segundo cuantificador de espectro 107 codifica y emite la información de retardo y la ganancia al multiplexor 108 como la segunda información codificada.
Obsérvese que, en general, el ancho de banda de una subbanda en un intervalo de alta frecuencia se establece más amplio que una subbanda en un intervalo de baja frecuencia. No obstante, algunas subbandas en un intervalo de baja frecuencia sometidas a copiado tienen baja energía y pueden no estar sometidas a cuantificación de vector de malla. En este caso, tales subbandas puede suponerse que son espectros cero o se puede agregar ruido para evitar cambio espectral repentino entre subbandas.
El multiplexor 108 multiplexa y emite la energía de subbanda cuantificada, la primera información codificada, la segunda información codificada y las banderas con picos/tonales a la antena A como información codificada.
La antena A transmite la información codificada a un aparato de decodificación de señal de audio. La información codificada alcanza al aparato de decodificación de señal de audio por medio de diversos nodos y estaciones base.
Ahora, el asignador de bits 104 se describirá con detalle a continuación.
La figura 2 es un diagrama de bloques que ilustra una configuración detallada y una operación del asignador de bits 104 del aparato de codificación de señal de audio 100 de acuerdo con la primera realización. El asignador de bits 104 que se ilustra en la figura 2 incluye un reservador de bits 111, un reservador de bits 112, un calculador de asignación de bits 113 y un determinador de modo de cuantificación 114.
El reservador de bits 111 hace referencia a las banderas con picos/tonales que se transmiten desde el calculador de tonalidad 103 y reserva un número de bits necesarios para segunda cuantificación de espectro realizada por el segundo cuantificador de espectro 107 si cualquiera de las banderas con picos/tonales se establece a cero.
En esta realización, se reserva un número de bits necesarios para codificar información de retardo basándose en filtro de tono. El número reservado de bits se excluyen del presupuesto de bits, el cual corresponde al número total de bits disponibles para cuantificación y el presupuesto de bits restante se emite al reservador de bits 112. Obsérvese que el presupuesto de bits se suministra por el cuantificador de energía de subbanda 102, lo que significa que los bits que permanecen después de excluir el número de bits necesarios para codificación variable de energía de subbanda cuantificada están disponibles para el primer cuantificador de espectro 106, para el segundo cuantificador de espectro 107 y para cuantificación (codificación) de las banderas con picos/tonales. El cuantificador de energía de subbanda 102 no necesariamente genera información acerca del presupuesto de bits.
El reservador de bits 112 reserva un número de bits utilizados para las banderas con picos/tonales. En la primera realización, las banderas con picos/tonales se transmiten mediante la utilización de cinco subbandas en un intervalo de alta frecuencia y por lo tanto, el reservador de bits 112 reserva cinco bits, por ejemplo.
El reservador de bits 112 emite, al calculador de asignación de bits 113, el cual es un asignador de bits adaptable, un número de bits que permanecen después de excluir el número de bits reservados por el reservador de bits 112 del presupuesto de bits introducido desde el reservador de bits 111. La suma del número de bits reservados por el reservador de bits 111 y el número de bits reservados por el reservador de bits 112 corresponde a un tercer número de bits. Una subbanda para la cual el indicador con picos/tonal se establece en cero, corresponde a una tercera subbanda.
Obsérvese que el orden del reservador de bits 111 y el reservador de bits 112 puede cambiarse. En esta realización, el reservador de bits 111 y el reservador de bits 112 son bloques separados; no obstante, las operaciones de estos reservadores se pueden realizar simultáneamente en un solo bloque. Como alternativa, las operaciones se pueden realizar dentro del calculador de asignación de bits 113.
El calculador de asignación de bits 113 calcula una asignación de bits a una subbanda sobre la cual se realiza cuantificación por el primer cuantificador de espectro 106. Específicamente, el calculador de asignación de bits 113 asigna en primer lugar el número de bits emitidos desde el reservador de bits 112 a cada subbanda mientras hace referencia a la energía de subbanda cuantificada. La asignación se realiza con un método descrito en la sección de la técnica relacionada en la cual se realiza la determinación con respecto a si una subbanda es esencial para escuchar, basándose en la magnitud de la energía de subbanda cuantificada, una subbanda que se determina que es esencial se le proporciona prioridad, y se realiza asignación de bits sobre la subbanda. Como resultado, no se asignan bits a una subbanda que tiene una energía de subbanda cuantificada igual a cero, menor que cero o menor que un valor predeterminado.
Tras la asignación, el calculador de asignación de bits 113 hace referencia a las banderas con picos/tonales de entrada y excluye subbandas (terceras subbandas) a partir de las cuales las banderas con picos/tonales se establecen a cero a partir de la asignación de bits. Esto es, el calculador de asignación de bits 113 identifica únicamente subbandas que tienen presentación de picos alta (subbandas para las cuales las banderas con picos/tonales se establecen en uno) para que sean subbandas objetivo para asignación de bits y asigna bits a las subbandas. El calculador de asignación de bits 113 identifica las subbandas (primeras subbandas) a las cuales van a asignarse los bits, crea información de bits asignada que indica el número de bits que van a asignarse a las subbandas y emite la información al determinador de modo de cuantificación 114 en primer lugar.
El determinador de modo de cuantificación 114 recibe la información de bits asignada o transmitida desde el calculador de asignación de bits 113 y las banderas con picos/tonales. En un caso donde está presente una subbanda en un intervalo de alta frecuencia que tiene una tonalidad alta (que se somete a cuantificación por el primer cuantificador de espectro 106) y a la que no se le ha asignado bit, el determinador de modo de cuantificación 114 redefine la subbanda como una subbanda (cuarta subbanda) sobre la cual se realiza la cuantificación por el segundo cuantificador de espectro 107 y emite un número de bits (cuarto número de bits) necesario para cuantificación por el segundo cuantificador de espectro al calculador de asignación de bits 113 para restar el número de bits de la información de bit asignada. Esto es, el determinador de modo de cuantificación 114 asigna el número de bits necesarios para cuantificación por el segundo cuantificador de espectro 107 a la banda de interés y emite el número de bits asignados (cuarto número de bits). De manera alternativa, el determinador de modo de cuantificación 114 puede restar el número de bits asignados a partir del presupuesto de bits disponible al primer cuantificador de espectro 106 y emitir el resultado al calculador de asignación de bits 113.
El determinador de modo de cuantificación 114 identifica subbandas sobre las cuales se realiza cuantificación por el segundo cuantificador de espectro 107 y emite el resultado al segundo cuantificador de espectro 107 como un modo de cuantificación. Específicamente, el determinador de modo de cuantificación 114 especifica subbandas (terceras subbandas) en un intervalo de alta frecuencia que tienen una baja tonalidad (para las cuales las banderas con picos/tonales se establecen a cero) y subbandas (cuartas subbandas) en un intervalo de alta frecuencia a las cuales no se les han asignado bit como subbandas (segundas subbandas) sobre las cuales se realiza cuantificación por el segundo cuantificador de espectro 107 y emite las subbandas como un modo de cuantificación.
De nuevo, el calculador de asignación de bits 113 actualiza el presupuesto de bits al restar el número de bits (cuarto número de bits) recibidos del determinador de modo de cuantificación 114 a partir del número de bits (presupuesto de bits) introducido desde el reservador de bits 112 y vuelve a calcular la asignación de bits a una subbanda sobre la cual se realiza la cuantificación por el primer cuantificador de espectro 106. En un caso de recibir el presupuesto de bits actualizado a partir del determinador de modo de cuantificación, el calculador de asignación de bits 113 vuelve a calcular la asignación de bits a una subbanda sobre la cual se realiza la cuantificación por el primer cuantificador de espectro 106 mediante la utilización del presupuesto de bits actualizado. En consecuencia, el primer número de bits es igual a un valor obtenido al restar el tercer número de bits y el cuarto número de bits del número de bits total (presupuesto de bits).
El calculador de asignación de bits 113 emite el número de bits (primer número de bits) obtenido después del recálculo y la información acerca de las subbandas (primeras subbandas) sobre las cuales se realiza la cuantificación por el primer cuantificador de espectro 106 al primer cuantificador de espectro 106 esta vez como información de bit asignado.
En un caso donde el recálculo no necesita realizarse debido a que todas las subbandas son bits asignados como resultado del primer cálculo de la asignación de bits por el calculador de asignación de bits 113, por ejemplo, el calculador de asignación de bits 113 puede emitir la información de bits asignada directamente al primer cuantificador de espectro 106.
La figura 3 es un diagrama de flujo de una operación realizada por el aparato de codificación de señal de audio 100 de acuerdo con la primera realización, específicamente, una operación realizada por el asignador de bits 104.
En primer lugar, el asignador de bits 104 obtiene energía de subbanda cuantificada a partir del cuantificador de energía de subbanda 102 (S1).
Después, el asignador de bits 104 obtiene banderas con picos/tonales en un intervalo de alta frecuencia a partir del calculador de tonalidad 103 (S2).
El asignador de bits 104 posteriormente identifica subbandas (terceras subbandas) sobre las cuales va a realizarse la cuantificación por el segundo cuantificador de espectro 107 basándose en las banderas con picos/tonales y el reservador de bits 111 y el reservador de bits 112 en el mismo reservan bits (tercer número de bits) utilizados en la cuantificación por el segundo cuantificador de espectro 107 (S3).
El calculador de asignación de bits 113 en el asignador de bits 104 determina un número de bits que van a asignarse a las subbandas que se someten a cuantificación por el primer cuantificador de espectro 106 basándose en la energía de subbanda cuantificada (S4).
El determinador de modo de cuantificación 114 en el asignador de bits 104 verifica el número de bits asignados a las subbandas en un intervalo de alta frecuencia determinado por el calculador de asignación de bits 113, identifica nuevamente las subbandas (segundas subbandas) sobre las cuales va a realizarse la cuantificación por el segundo cuantificador de espectro 107 según sea necesario y actualiza el presupuesto de bits para el primer cuantificador 106 de subbanda (S5).
Finalmente, el calculador de asignación de bits 113 en el asignador de bits 104 vuelve a calcular la asignación de bits (primer número de bits) al primer cuantificador de espectro 106 mediante el uso del presupuesto de bits actualizado (S6).
Con el aparato de codificación de señal de audio de acuerdo con esta realización, es posible realizar codificación de señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
Específicamente, con las configuraciones y operaciones en la figura 2 y en la figura 3, es posible realizar asignación de bits que no produzca una subbanda sobre la cual no se realice cuantificación (el número de bits asignados se vuelve cero) en un intervalo de alta frecuencia en el cual la anchura de subbanda es específicamente amplia y que maximice el número de subbandas sobre las cuales se realiza cuantificación por el primer cuantificador. En consecuencia, es posible realizar asignación de bits adaptable que pueda alcanzar el mejor desempeño a una tasa de bits limitada.
(Segunda realización)
La figura 4 es un diagrama de bloques que ilustra una configuración y una operación de un aparato de decodificación de señal de audio 200 de acuerdo con una segunda realización. El aparato de decodificación de señal de audio 200 que se ilustra en la figura 4 incluye un demultiplexor 201, un decodificador de energía de subbanda 202, un asignador de bits 203, un primer decodificador de espectro 204, un segundo decodificador de espectro 205, un de-normalizador 206 y un transformador de frecuencia tiempo 207. Al demultiplexor 201 se conecta una antena a A. El aparato de decodificación de señal de audio 200 y la antena A juntos constituyen un aparato terminal o un aparato de estación de base.
El demultiplexor 201 recibe información codificada recibida por la antena A y demultiplexa la información codificada en energía de subbanda cuantificada codificada, primera información codificada, segunda información codificada y banderas con picos/tonales. El demultiplexor 201 emite la energía de subbanda cuantificada codificada al decodificador de energía de subbanda 202, la primera información codificada al primer decodificador de espectro 204, la segunda información codificada al segundo decodificador de espectro 205 y las banderas con picos/tonales al asignador de bits 203.
El decodificador de energía de subbanda 202 decodifica la energía de subbanda cuantificada codificada, genera energía de subbanda cuantificada decodificada y emite la energía de subbanda cuantificada decodificada al asignador de bits 203 y al de-normalizador 206.
El asignador de bits 203 hace referencia a la energía de subbanda cuantificada decodificada de cada subbanda y a las banderas con picos/tonales y determina asignación de bits que se asignan por el primer decodificador de espectro 204 y aquellos que se asignan por el segundo decodificador de espectro 205. Específicamente, el asignador de bits 203 determina el número de bits (primer número de bits) que van a asignarse en la decodificación de la primera información decodificada por el primer decodificador de espectro 204 y las subbandas (primeras subbandas) a las cuales se asignan los bits y emiten resultado como información de bit asignado. Además, el asignador de bits 203 identifica y selecciona subbandas (segundas subbandas) para las cuales la segunda información codificada va a decodificarse por el segundo decodificador de espectro 205 y emite el resultado al segundo decodificador de espectro 205 como un modo de cuantificación.
El asignador de bits 203 tiene la misma configuración y realiza la misma operación que en el asignador de bits 104 que se ilustra en la figura 5 y que se describe en la descripción del aparato de codificación. Por lo tanto, para los detalles de la operación, hágase referencia a la descripción del asignador de bits 104 en el aparato de codificación.
El primer decodificador de espectro 204 decodifica la primera información codificada mediante la utilización de un primer número de bits indicados por la información de bits asignada, genera un primer espectro decodificado y emite el primer espectro decodificado al segundo decodificador de espectro 205.
El segundo decodificador de espectro 205 utiliza el primer espectro decodificado para las subbandas identificadas con el modo de cuantificación, decodifica la segunda información codificada, genera un segundo espectro decodificado, genera un espectro reconstruido al combinar el segundo espectro decodificado con el primer espectro decodificado y emite el espectro reconstruido.
El de-normalizador 206 ajusta la amplitud (ganancia) del espectro reconstruido mientras hace referencia a la energía de subbanda cuantificada decodificada y emite el resultado al transformador de frecuencia tiempo 207.
El transformador 207 de frecuencia-tiempo transforma el espectro reconstruido en un dominio de frecuencia dentro de una señal de audio de salida en un dominio de tiempo y emite la señal de audio de salida. Los ejemplos de la transformada frecuencia-tiempo incluyen una transformada que es la inversa de la transformada descrita en la descripción de la transformada de frecuencia-tiempo.
Con el aparato de decodificación de señal de audio de acuerdo con esta realización, es posible realizar decodificación de señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
(Conclusión)
El aparato de codificación de señal de audio y el aparato de decodificación de señal de audio de acuerdo con la presente divulgación se han descrito en la primera y segunda realizaciones. El aparato de codificación y el aparato de decodificación de acuerdo con la presente divulgación pueden estar conceptualmente en forma de un producto semiterminado o un componente, tal como una placa de sistema o un dispositivo semiconductor, o en forma de un producto terminado como por ejemplo un aparato terminal o un aparato de estación de base. En el caso donde el aparato de codificación y el aparato de decodificación de acuerdo con la presente divulgación están en la forma de un producto o un componente semi-terminado, el aparato de codificación y el aparato de decodificación se combinan con una antena, un convertidor de DA/AD, un amplificador, un altavoz, un micrófono, y así sucesivamente, para conformar un producto terminado.
Obsérvese que los diagramas de bloques en las figuras 1,2, 4 y 5 ilustran las configuraciones y operaciones (métodos) de los dispositivos de hardware diseñados exclusivamente y pueden ser aplicables a un caso donde un programa para realizar las operaciones (métodos) de la presente divulgación está instalado en un dispositivo de hardware de fin general y se ejecuta por un procesador para de esta manera implementar las operaciones (métodos). Los ejemplos del dispositivo de hardware de fin general, el cual es un ordenador, incluyen diversos terminales de información portátiles, tales como un ordenador personal y un teléfono inteligente y diversos teléfonos portátiles.
Los ejemplos de los dispositivos de hardware diseñados exclusivamente incluyen no solo productos terminados (productos electrónicos para el consumidor), tales como un teléfono portátil y un teléfono fijo, sino también productos semi-terminados y componentes, tales como una placa de sistema y un dispositivo semiconductor.
Aplicabilidad industrial
El aparato de codificación de señal de audio y el aparato de decodificación de señal de audio de acuerdo con la presente divulgación son aplicables a una máquina o a un componente involucrado en grabación, transmisión y reproducción de señales de audio. Lista de signos de referencia
100 aparato de codificación de señal de audio
101 transformador de tiempo-frecuencia
102 cuantificador de energía de subbanda
103 calculador de tonalidad
104 asignador de bits
105 normalizador
106 primer cuantificador de espectro
107 segundo cuantificador de espectro
108 multiplexor
111 reservador de bits
112 reservador de bits
113 calculador de asignación de bits
114 determinador de modo de cuantificación
200 aparato de decodificación de señal de audio
201 demultiplexor
202 decodificador de energía de subbanda
203 asignador de bits
204 primer decodificador de espectro
205 segundo decodificador de espectro
206 de-normalizador
207 transformador de frecuencia-tiempo
211 reservador de bits
212 reservador de bits
213 calculador de asignación de bits
214 determinador de modo de cuantificación
Claims (6)
1. Un aparato de codificación de señal de audio, que comprende:
un transformador de tiempo-frecuencia (101) adaptado para generar un espectro realizando una transformada en una señal de audio de entrada en un dominio de frecuencia, para dividir el espectro en subbandas, que son bandas de frecuencia predeterminadas, y para emitir espectros de subbandas, en donde la señal de audio de entrada comprende una señal de música, una señal de voz o una señal, en la que se mezclan una señal de música y una señal de voz;
un cuantificador de energía de subbanda (102) adaptado para obtener, para cada una de las subbandas, una energía de subbanda cuantificada;
un calculador de tonalidad (103) adaptado para analizar una tonalidad de los espectros de subbanda y para emitir un resultado de análisis;
un asignador de bits (104) adaptado para seleccionar una segunda subbanda en la que se realiza una cuantificación por un segundo cuantificador (107) de entre las subbandas sobre la base del resultado del análisis de la tonalidad y la energía de subbanda cuantificada, y para determinar un primer número de bits que se asignarán a una primera subbanda, entre las subbandas, en la que se realiza la cuantificación por un primer cuantificador (106); y
un multiplexor (108) adaptado para multiplexar en información la información codificada emitida desde el primer cuantificador (106) y desde el segundo cuantificador (107), la energía de subbanda cuantificada y el resultado del análisis de la tonalidad, y para emitir la información multiplexada, en el que
el primer cuantificador (106) está adaptado para codificar por impulsos un espectro de subbandas entre los espectros de subbandas que están incluidos en la primera subbanda usando el primer número de bits, y el segundo cuantificador (107) está adaptado para codificar un espectro de subbandas entre los espectros de subbandas que están incluidos en la segunda subbanda mediante el uso de un filtro de tono.
2. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1,
en el que el asignador de bits (104) está adaptado para seleccionar la segunda subbanda de entre las subbandas que están en un intervalo de alta frecuencia.
3. Aparato de codificación de señal de audio de acuerdo con la reivindicación 2,
en el que el asignador de bits (104) está adaptado para seleccionar una subbanda, entre las subbandas, en la que la tonalidad es menor que un umbral predeterminado como la segunda subbanda.
4. Aparato de codificación de señal de audio de acuerdo con la reivindicación 2, en el que
el asignador de bits (104) está adaptado para seleccionar una subbanda entre las subbandas que tiene la energía de subbanda cuantificada igual a cero o menor que un valor predeterminado como la segunda subbanda.
5. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, en el que
el asignador de bits (104) está adaptado para determinar el primer número de bits restando un segundo número de bits a asignar a la segunda subbanda de un número total de bits disponibles para la cuantificación.
6. Aparato de codificación de señal de audio de acuerdo con la reivindicación 5, en el que
el asignador de bits (104) está adaptado para calcular un tercer número de bits, entre el número total de bits, que se asignarán a una tercera subbanda seleccionada de entre las subbandas en función del resultado del análisis de la tonalidad, para seleccionar como cuarta subbanda una subbanda, entre las subbandas, a la que no se asigna ningún bit cuando se asigna un número de bits obtenido restando el tercer número de bits del número total de bits a la primera subbanda sobre la base de la energía de subbanda cuantificada, y calcular un cuarto número de bits a asignar en un caso en el que el segundo cuantificador (107) realiza la codificación en la cuarta subbanda, seleccionar la tercera subbanda y la cuarta subbanda como otras segundas subbandas en las que el segundo cuantificador (107) realiza la cuantificación, y determinar un número de bits obtenido restando el tercer número de bits y el cuarto número de bits del número total de bits a el primer número de bits que se asignarán a la primera subbanda en la que el primer cuantificador (106) realiza la cuantificación.
Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, en el que
el resultado de análisis del calculador de tonalidad (103) se emite como una bandera que indica si la tonalidad es o no mayor que un umbral predeterminado.
Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, estando configurado el aparato: para obtener (S1) las energías de subbanda cuantificadas,
para obtener (S2) banderas con picos/tonales en un intervalo de alta frecuencia,
identificar (S3) subbandas en las que el segundo cuantificador (107) debe realizar la cuantificación y reservar bits para ser utilizados en la cuantificación por el segundo cuantificador (107),
para determinar (S4) un número de bits a asignar a las subbandas que deben ser cuantificadas por el primer cuantificador (106) sobre la base de las energías de subbanda cuantificadas,
para comprobar (S5) el número de bits asignados a las subbandas en el intervalo de alta frecuencia, para identificar de nuevo segundas subbandas en las que se va a realizar cuantificación por el segundo cuantificador (107) según sea necesario, y para actualizar un presupuesto de bits para el primer cuantificador (106), y
para recalcular (S6) una asignación de bits para el primer cuantificador (106) sobre la base de las energías de subbanda cuantificadas utilizando el presupuesto de bits actualizado.
Aparato de decodificación de señal de audio para decodificar información codificada, comprendiendo el aparato de decodificación de señal de audio:
un demultiplexor (201) adaptado para demultiplexar la información codificada en primera información codificada, segunda información codificada, una energía de subbanda cuantificada obtenida cuantificando la energía de cada subbanda entre subbandas, y un resultado de análisis de una tonalidad calculada para cada subbanda entre las subbandas;
un asignador de bits (203) adaptado para seleccionar la segunda subbanda en la que se realiza la decodificación mediante un segundo decodificador (205) de entre las subbandas basándose en el resultado del análisis de la tonalidad y la energía de subbanda cuantificada, y
para determinar el primer número de bits que se asignarán a una primera subbanda, entre las subbandas, cuya decodificación se realiza mediante un primer decodificador (204); y
un transformador de frecuencia-tiempo (207) adaptado para generar y emitir una señal de audio de salida realizando una transformada en una salida de espectro del segundo decodificador (205) en un dominio de tiempo, en el que
el primer decodificador (204) está adaptado para generar un primer espectro decodificado decodificando la primera información codificada usando el primer número de bits, y
el segundo decodificador (205) está adaptado para generar un segundo espectro decodificado decodificando la segunda información codificada y para generar un espectro reconstruido realizando decodificación usando el segundo espectro decodificado y el primer espectro decodificado,
en el que la señal de audio de salida comprende una señal de música, una señal de voz o una señal, en la que se mezclan una señal de música y una señal de voz.
Un aparato terminal que comprende:
el aparato de codificación de señal de audio de acuerdo con la reivindicación 1; y
una antena adaptada para transmitir la información codificada.
Un aparato terminal que comprende:
una antena adaptada para recibir y emitir al demultiplexor (201) la información codificada; y
el aparato de decodificación de señales de audio de acuerdo con la reivindicación 9.
Un método de codificación de señal de audio que comprende:
generar un espectro realizando una transformada en una señal de audio de entrada en un dominio de frecuencia, en donde la señal de audio de entrada comprende una señal de música, una señal de voz o una señal, en la que se mezclan una señal de música y una señal de voz;
dividir el espectro en subbandas, que son bandas de frecuencia predeterminadas, y emitir espectros de subbanda;
obtener, para cada una de las subbandas, una energía de subbanda cuantificada;
analizar la atonalidad de los espectros de subbanda y emitir un resultado del análisis;
seleccionar una segunda subbanda de entre las subbandas en función del resultado del análisis de la tonalidad y la energía de subbanda cuantificada;
determinar un primer número de bits a asignar a una primera subbanda entre las subbandas; generar la primera información codificada mediante la codificación de un espectro de subbandas entre los espectros de subbandas que se incluyen en la primera subbanda mediante el uso del primer número de bits; generar una segunda información codificada mediante la codificación de un espectro de subbandas entre los espectros de subbandas que se incluyen en la segunda subbanda mediante el uso de un filtro de tono; y multiplexar juntos y emitir la primera información codificada y la segunda información codificada.
Método de decodificación de señal de audio para decodificar información codificada, comprendiendo el método de decodificación de señal de audio:
demultiplexar la información codificada en primera información codificada, segunda información codificada, una energía de subbanda cuantificada obtenida cuantificando una energía de cada subbanda entre subbandas, y un resultado de análisis de atonalidad calculado para cada subbanda entre las subbandas; seleccionar una segunda subbanda de entre las subbandas en función del resultado del análisis de la tonalidad y la energía de subbanda cuantificada;
determinar un primer número de bits a asignar a una primera subbanda entre las subbandas; generar un primer espectro decodificado decodificando la primera información codificada usando el primer número de bits;
generar un segundo espectro decodificado decodificando la segunda información codificada, y generar un espectro reconstruido realizando decodificación usando el segundo espectro decodificado y el primer espectro decodificado; y
generar y emitir una señal de audio de salida realizando una transformada en el espectro reconstruido en un dominio de tiempo, en donde la señal de audio de salida comprende una señal de música, una señal de voz o una señal, en la que se mezclan una señal de música y una señal de voz.
Programa informático que comprende instrucciones que, cuando el programa es ejecutado por un ordenador, hacen que el ordenador lleve a cabo el método de la reivindicación 12 o el método de la reivindicación 13.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201462028805P | 2014-07-25 | 2014-07-25 | |
| JP2014219214 | 2014-10-28 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2989615T3 true ES2989615T3 (es) | 2024-11-27 |
Family
ID=55162710
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES20176535T Active ES2989615T3 (es) | 2014-07-25 | 2015-07-03 | Aparato de codificación de señales de audio, aparato de decodificación de señales de audio, método de codificación de señales de audio y método de decodificación de señales de audio |
Country Status (14)
| Country | Link |
|---|---|
| US (3) | US10311879B2 (es) |
| EP (3) | EP3174050B1 (es) |
| JP (1) | JP6717746B2 (es) |
| KR (1) | KR102165403B1 (es) |
| CN (2) | CN106133831B (es) |
| AU (1) | AU2015291897B2 (es) |
| BR (1) | BR112017000629B1 (es) |
| CA (1) | CA2958429C (es) |
| ES (1) | ES2989615T3 (es) |
| MX (1) | MX356371B (es) |
| PL (3) | PL3413307T3 (es) |
| RU (1) | RU2669706C2 (es) |
| SG (1) | SG11201701197TA (es) |
| WO (1) | WO2016013164A1 (es) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106463143B (zh) | 2014-03-03 | 2020-03-13 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
| JP6616316B2 (ja) * | 2014-03-24 | 2019-12-04 | サムスン エレクトロニクス カンパニー リミテッド | 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置 |
| JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
| US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
| US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
| US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
| WO2021003569A1 (en) | 2019-07-08 | 2021-01-14 | Voiceage Corporation | Method and system for coding metadata in audio streams and for flexible intra-object and inter-object bitrate adaptation |
| EP4485457A1 (en) | 2019-08-20 | 2025-01-01 | Dolby International AB | Multi-lag format for audio coding |
| EP3786948A1 (en) * | 2019-08-28 | 2021-03-03 | Fraunhofer Gesellschaft zur Förderung der Angewand | Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar |
| CN113192517B (zh) * | 2020-01-13 | 2024-04-26 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
| CN113808597B (zh) | 2020-05-30 | 2024-10-29 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
| EP4120253A1 (en) * | 2021-07-14 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Integral band-wise parametric coder |
Family Cites Families (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3250376B2 (ja) * | 1994-06-13 | 2002-01-28 | ソニー株式会社 | 情報符号化方法及び装置並びに情報復号化方法及び装置 |
| JP3283413B2 (ja) | 1995-11-30 | 2002-05-20 | 株式会社日立製作所 | 符号化復号方法、符号化装置および復号装置 |
| JP3157116B2 (ja) * | 1996-03-29 | 2001-04-16 | 三菱電機株式会社 | 音声符号化伝送システム |
| US7389227B2 (en) * | 2000-01-14 | 2008-06-17 | C & S Technology Co., Ltd. | High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder |
| US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
| US7844451B2 (en) | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
| DE602004032587D1 (de) * | 2003-09-16 | 2011-06-16 | Panasonic Corp | Codierungsvorrichtung und Decodierungsvorrichtung |
| DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
| DE102004007184B3 (de) * | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
| JP2005265865A (ja) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | オーディオ符号化のためのビット割り当て方法及び装置 |
| JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
| US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
| CN101548316B (zh) * | 2006-12-13 | 2012-05-23 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
| JP5403949B2 (ja) | 2007-03-02 | 2014-01-29 | パナソニック株式会社 | 符号化装置および符号化方法 |
| KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
| EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
| CN101853663B (zh) * | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
| CN102063905A (zh) * | 2009-11-13 | 2011-05-18 | 数维科技(北京)有限公司 | 一种用于音频解码的盲噪声填充方法及其装置 |
| JP5809066B2 (ja) * | 2010-01-14 | 2015-11-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声符号化方法 |
| CN102194458B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 频带复制方法、装置及音频解码方法、系统 |
| US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
| US8660195B2 (en) * | 2010-08-10 | 2014-02-25 | Qualcomm Incorporated | Using quantized prediction memory during fast recovery coding |
| BR112015009352B1 (pt) | 2012-11-05 | 2021-10-26 | Panasonic Intellectual Property Corporation Of America | Dispositivo de codificação de fala/áudio, dispositivo de decodificação de fala/áudio, método de codificação de fala/áudio e método de decodificação de fala/áudio |
| JP6535466B2 (ja) * | 2012-12-13 | 2019-06-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法 |
| MY176447A (en) * | 2013-04-05 | 2020-08-10 | Dolby Int Ab | Audio encoder and decoder |
| KR102072365B1 (ko) * | 2013-04-05 | 2020-02-03 | 돌비 인터네셔널 에이비 | 고급 양자화기 |
| ES2975073T3 (es) | 2014-03-31 | 2024-07-03 | Fraunhofer Ges Forschung | Codificador, descodificador, procedimiento de codificación, procedimiento de descodificación y programa |
-
2015
- 2015-07-03 SG SG11201701197TA patent/SG11201701197TA/en unknown
- 2015-07-03 KR KR1020167024863A patent/KR102165403B1/ko active Active
- 2015-07-03 EP EP15824312.1A patent/EP3174050B1/en active Active
- 2015-07-03 EP EP20176535.1A patent/EP3723086B1/en active Active
- 2015-07-03 CN CN201580015301.4A patent/CN106133831B/zh active Active
- 2015-07-03 CA CA2958429A patent/CA2958429C/en active Active
- 2015-07-03 BR BR112017000629-4A patent/BR112017000629B1/pt active IP Right Grant
- 2015-07-03 EP EP18186595.7A patent/EP3413307B1/en active Active
- 2015-07-03 RU RU2017102311A patent/RU2669706C2/ru active
- 2015-07-03 PL PL18186595T patent/PL3413307T3/pl unknown
- 2015-07-03 PL PL15824312T patent/PL3174050T3/pl unknown
- 2015-07-03 ES ES20176535T patent/ES2989615T3/es active Active
- 2015-07-03 WO PCT/JP2015/003358 patent/WO2016013164A1/ja not_active Ceased
- 2015-07-03 PL PL20176535.1T patent/PL3723086T3/pl unknown
- 2015-07-03 JP JP2016535772A patent/JP6717746B2/ja active Active
- 2015-07-03 MX MX2016015786A patent/MX356371B/es active IP Right Grant
- 2015-07-03 AU AU2015291897A patent/AU2015291897B2/en active Active
- 2015-07-03 CN CN202111171436.3A patent/CN114023341A/zh active Pending
-
2016
- 2016-11-17 US US15/353,780 patent/US10311879B2/en active Active
-
2019
- 2019-03-29 US US16/370,748 patent/US10643623B2/en active Active
-
2020
- 2020-03-17 US US16/821,784 patent/US11521625B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2989615T3 (es) | Aparato de codificación de señales de audio, aparato de decodificación de señales de audio, método de codificación de señales de audio y método de decodificación de señales de audio | |
| ES2706148T3 (es) | Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento de codificación de audio vocal, y procedimiento de decodificación de audio vocal | |
| ES2823250T3 (es) | Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo | |
| HK40000355B (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof | |
| HK40000355A (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof | |
| HK1238789B (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof | |
| HK1238789A1 (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof | |
| HK40002240A (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK1242832B (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| HK1242832A1 (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method |