ES3020522T3 - Signal processing apparatus and method, and program - Google Patents

Signal processing apparatus and method, and program Download PDF

Info

Publication number
ES3020522T3
ES3020522T3 ES22167951T ES22167951T ES3020522T3 ES 3020522 T3 ES3020522 T3 ES 3020522T3 ES 22167951 T ES22167951 T ES 22167951T ES 22167951 T ES22167951 T ES 22167951T ES 3020522 T3 ES3020522 T3 ES 3020522T3
Authority
ES
Spain
Prior art keywords
low
frequency range
signal
range
range band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES22167951T
Other languages
English (en)
Inventor
Yuki Yamamoto
Toru Chinen
Mitsuyuki Hatanaka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Application granted granted Critical
Publication of ES3020522T3 publication Critical patent/ES3020522T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Se describe un método, un sistema y un programa informático para procesar una señal de audio codificada. En una realización ejemplar, el sistema recibe una señal codificada de baja frecuencia e información de energía codificada para desplazar la frecuencia de dicha señal. Esta señal se decodifica y se suaviza su depresión de energía. La señal suavizada se desplaza para generar una señal de alta frecuencia. Las señales de baja y alta frecuencia se combinan y emiten. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Aparato y método de procesamiento de señales, y programa
Campo técnico
La presente descripción se refiere a un aparato y método de procesamiento de señales, así como a un programa. Más particularmente, una realización se refiere a un aparato y método de procesamiento de señales, así como a un programa configurado de manera que se obtenga audio de mayor calidad en el caso de decodificar una señal de audio codificada.
Antecedentes de la técnica
Convencionalmente, HE-AAC (técnica según el Grupo de expertos de imágenes en movimiento [Moving Pictures Experts Group - MPEG] 4 con Codificación Avanzada de Audio [Advanced Audio Coding - AAC]) (norma internacional ISO/CEI 14496-3), etc., se conoce como técnicas de codificación de señales de audio. Con tales técnicas de codificación se usa una tecnología de codificación de características de rango alto llamada Replicación de la Banda Espectral (Spectral Band Replication - SBR) (por ejemplo, véase PTL 1).
Con la SBR, cuando se codifica una señal de audio, los componentes codificados de rango bajo de la señal de audio (de aquí en adelante denominada señal de rango bajo, es decir, una señal de rango de baja frecuencia) se emiten junto con la información de SBR para generar componentes de rango alto de la señal de audio (de aquí en adelante denominada señal de rango alto, es decir, una señal de rango de alta frecuencia). Con un aparato de decodificación se decodifica la señal de rango bajo codificada, mientras que, además, la señal de rango bajo obtenida mediante la decodificación y la información de SBR se usa para generar una señal de rango alto, y se obtiene una señal de audio que consiste en la señal de rango bajo y la señal de rango alto.
Más concretamente, supongamos que la señal SL1 de rango bajo ilustrada en la Fig. 1 se obtiene mediante decodificación, por ejemplo. En este caso, en la Fig. 1 el eje horizontal indica la frecuencia y el eje vertical indica la energía de las respectivas frecuencias de una señal de audio. Además, las líneas discontinuas verticales en el dibujo representan los límites de las bandas del factor de escala. Las bandas del factor de escala son bandas que agrupan varias subbandas de un ancho de banda determinado, es decir, la resolución de un filtro de análisis QMF (Filtro de Espejo en Cuadratura - Quadrature Mirror Filter).
En la Fig. 1, una banda que consiste en las siete bandas del factor de escala consecutivas en el lado derecho del dibujo de la señal SL1 de rango bajo se considera del rango alto. Las energías E11 a E17 de banda del factor de escala de rango alto se obtienen para cada una de las bandas del factor de escala en el lado de rango alto mediante la decodificación de la información de SBR.
De forma adicional, se usan la señal SL1 de rango bajo y las energías de banda del factor de escala de rango alto, y se genera una señal de rango alto para cada banda del factor de escala. Por ejemplo, en el caso de que se genere una señal de rango alto para la banda Bobj del factor de escala, los componentes de la banda Borg del factor de escala de fuera de la señal SL1 de rango bajo se cambian de frecuencia a la banda de la banda Bobj del factor de escala. La señal obtenida por el cambio de frecuencia se ajusta en ganancia y se considera una señal de rango alto. En este momento, el ajuste en ganancia se lleva a cabo de manera que la energía media de la señal obtenida por el cambio de frecuencia llegue a tener la misma magnitud que la energía E13 de banda del factor de escala de rango alto en la banda Bobj del factor de escala.
Según este procesamiento, la señal SH1 de rango alto ilustrada en la Fig. 2 se genera como el componente de la banda Bobj del factor de escala. En este caso, en la Fig. 2, se proporcionan señales de referencia idénticas a partes correspondientes al caso de la Fig. 1, y su descripción se omite o se reduce.
De esta manera, en el lado de decodificación de señales de audio, se usa una señal de rango bajo e información de SBR para generar componentes de rango alto no incluidos en una señal de rango bajo codificada y decodificada y expandir la banda, haciendo posible así reproducir audio de mayor calidad.
Lista de citas
Bibliografía de patentes
PTL 1: Publicación de solicitud de patente japonesa no examinada (traducción de la solicitud PCT) N.° 2001-521648
PTL2: WO2009/029037 describe la extensión del ancho de banda, en la que faltan por completo algunas subbandas de banda baja debido a los efectos de enmascaramiento en la codificación que forman agujeros espectrales. Cuando se regenera la banda alta a partir de la banda baja en el decodificador, estos huecos espectrales ya no se enmascaran en la banda alta, lo que produce artefactos. Para evitar tales artefactos, los agujeros espectrales de banda baja se rellenan con ruido.
Resumen de la invención
Se describe un método implementado por ordenador para procesar una señal de audio según la reivindicación 1.
También se describe un dispositivo para procesar una señal según la reivindicación 2.
También se describe, según la reivindicación 3, un medio de grabación de programas informáticos que incluye instrucciones que, cuando son ejecutadas por un procesador, llevan a cabo un método para procesar una señal de audio.
Problema técnico
Sin embargo, en los casos en los que hay un agujero en la señal SL1 de rango bajo utilizada para generar una señal de rango alto, es decir, en los que hay una señal de rango de baja frecuencia que tiene un espectro de energía de una forma que incluye una depresión de energía utilizada para generar una señal de rango de alta frecuencia, como la banda Borg del factor de escala en la Fig. 2, es muy probable que la forma de la señal SH1 de rango alto obtenida llegue a tener una forma muy diferente de la forma de frecuencia de la señal original, lo que se convierte en una causa de degradación auditiva. En este caso, el estado en el que hay un agujero en una señal de rango bajo se refiere a un estado en donde la energía de una banda dada es notablemente baja en comparación con las energías de las bandas adyacentes, con una parte del espectro de potencia de rango bajo (la forma de onda de energía de cada frecuencia) sobresaliendo hacia abajo en el dibujo. En otras palabras, se refiere a un estado en donde la energía de una parte de los componentes de la banda está deprimida, es decir, un espectro de energía de una forma que incluye una depresión de energía.
En el ejemplo de la Fig. 2, dado que existe una depresión en la señal de rango bajo, es decir, la señal de rango de baja frecuencia, SL1, utilizada para generar una señal de rango alto, es decir, una señal de rango de alta frecuencia, también se produce una depresión en la señal SH1 de rango alto. Si existe una depresión en una señal de rango bajo utilizada para generar una señal de rango alto de esta manera, los componentes de rango alto ya no se pueden reproducir con precisión y puede producirse una degradación auditiva en una señal de audio obtenida mediante decodificación.
Además, con la SBR, se puede llevar a cabo un procesamiento denominado limitación de ganancia e interpolación. En algunos casos, este procesamiento puede hacer que se produzcan depresiones en los componentes de rango alto,
En este caso, la limitación de ganancia es un procesamiento que suprime los valores máximos de la ganancia dentro de una banda limitada que consiste en varias subbandas hasta el valor medio de la ganancia dentro de la banda limitada.
Por ejemplo, supongamos que la señal SL2 de rango bajo ilustrada en la Fig. 3 se obtiene decodificando una señal de rango bajo. En este caso, en la Fig. 3, el eje horizontal indica la frecuencia y el eje vertical indica la energía de las respectivas frecuencias de una señal de audio. Además, las líneas discontinuas verticales en el dibujo representan los límites de las bandas del factor de escala.
En la Fig. 3, una banda que consiste en las siete bandas del factor de escala consecutivas en el lado derecho del dibujo de la señal SL2 de rango bajo se considera que es del rango alto. Al decodificar la información de SBR, se obtienen energías E21 a E27 de banda del factor de escala de rango alto.
Además, una banda que consiste en las tres bandas de Bobj1 a Bobj3 del factor de escala se considera una banda limitada. Además, supongamos que se usan los respectivos componentes de las bandas Borg1 a Borg3 del factor de escala de la señal s L2 de rango bajo, y que se generan las respectivas señales de rango alto para las bandas Bobj1 a Bobj3 del factor de escala en el lado de rango alto.
Por consiguiente, cuando se genera una señal SH2 de rango alto en la banda Bobj2 del factor de escala, el ajuste en ganancia se realiza básicamente según el diferencial de energía G2 entre la energía media de la banda Borg2 del factor de escala de la señal SL2 de rango bajo y la energía E22 de banda del factor de escala de rango alto. En otras palabras, el ajuste en ganancia se lleva a cabo cambiando la frecuencia las componentes de la banda Borg2 del factor de escala de la señal SL2 de rango bajo y multiplicando la señal obtenida como resultado por el diferencial de energía G2. Se considera que esta es la señal<s>H2 de rango alto.
Sin embargo, con la limitación de ganancia, si el diferencial de energía G2 es mayor que el valor medio G de los diferenciales de energía G1 a G3 de las bandas Bobj1 a Bobj3 del factor de escala dentro de la banda limitada, el diferencial de energía G2 por el que se multiplica una señal con cambio de frecuencia será considerado el valor medio G. En otras palabras, la ganancia de la señal de rango alto para la banda Bobj2 del factor de escala se suprimirá.
En el ejemplo de la Fig. 3, la energía de la banda Borg2 del factor de escala en la señal SL2 de rango bajo se ha reducido en comparación con las energías de las bandas Borg1 y Borg3 del factor de escala adyacentes. En otras palabras, se ha producido una depresión en la parte de la banda Borg2 del factor de escala.
Por el contrario, la energía E22 de banda del factor de escala de rango alto de la banda Bobj2 del factor de escala, es decir, el destino de la aplicación de los componentes de rango bajo, es mayor que las energías de banda del factor de escala de rango alto de las bandas Bobj1 y Bobj3 del factor de escala.
Por esta razón, el diferencial de energía G2 de la banda Bobj2 del factor de escala pasa a ser mayor que el valor medio G del diferencial de energía dentro de la banda limitada, y la ganancia de la señal de rango alto para la banda Bobj2 del factor de escala se suprime mediante la limitación de ganancia.
Por consiguiente, en la banda Bobj2 del factor de escala, la energía de la señal SH2 de rango alto pasa a ser drásticamente más baja que la energía E22 de banda del factor de escala de rango alto, y la forma de frecuencia de la señal de rango alto generada se convierte en una forma que difiere en gran medida de la forma de frecuencia de la señal original. Por lo tanto, la degradación auditiva se produce en el audio obtenido en última instancia mediante la decodificación.
Además, la interpolación es una técnica de generación de señales de rango alto que lleva a cabo el cambio de frecuencia y el ajuste en ganancia en cada subbanda en lugar de en cada banda del factor de escala.
Por ejemplo, como se ilustra en la Fig. 4, supongamos que se usan las respectivas subbandas Borg1 a Borg3 de la señal SL3 de rango bajo, se generan las respectivas señales de rango alto en las subbandas Bobj1 a Bobj3 en el lado de rango alto, y se considera que una banda que consiste en las subbandas Bobj1 a Bobj3 es una banda limitada. En este caso, en la Fig. 4, el eje horizontal indica la frecuencia y el eje vertical indica la energía de las respectivas frecuencias de una señal de audio. Además, al decodificar la información de SBR, se obtienen energías E31 a E37 de banda del factor de escala de rango alto para cada banda del factor de escala.
En el ejemplo de la Fig. 4, la energía de la subbanda Borg2 en la señal SL3 de rango bajo se ha reducido en comparación con las energías de las subbandas Borg1 y Borg3 adyacentes, y se ha producido una depresión en la parte de la subbanda Borg2. Por esta razón, y de manera similar al caso de la Fig. 3, el diferencial de energía entre la energía de la subbanda Borg2 de la señal SL3 de rango bajo y la energía E33 de banda del factor de escala de rango alto pasa a ser mayor que el valor medio del diferencial de energía dentro de la banda limitada. Por lo tanto, la ganancia de la señal SH3 de rango alto en la subbanda Bobj2 se suprime mediante la limitación de ganancia.
Como resultado, en la subbanda Bobj2, la energía de la señal SH3 de rango alto pasa a ser drásticamente más baja que la energía E33 de banda del factor de escala de rango alto, y la forma de frecuencia de la señal de rango alto generada puede convertirse en una forma que difiere en gran medida de la forma de frecuencia de la señal original. Por lo tanto, de manera similar al caso de la Fig. 3, se produce una degradación auditiva en el audio obtenido mediante la decodificación.
Como en lo anterior, con la SBR, ha habido casos en los que no se obtiene audio de alta calidad de audio en el lado de decodificación de la señal de audio debido a la forma (forma de frecuencia) del espectro de potencia de una señal de rango bajo utilizada para generar una señal de rango alto.
Efectos ventajosos de la invención
Según un aspecto de una realización, se puede obtener audio de mayor calidad en el caso de decodificar una señal de audio.
Breve descripción de los dibujos
La Fig. 1 es un diagrama que explica la SBR convencional.
La Fig. 2 es un diagrama que explica la SBR convencional.
La Fig. 3 es un diagrama que explica la limitación de ganancia convencional.
La Fig. 4 diagrama que explica la interpolación convencional.
La Fig. 5 diagrama que explica la SBR a la que se ha aplicado una realización.
La Fig. 6 es un diagrama que ilustra una configuración ilustrativa de una realización de un codificador al que se ha aplicado una realización.
La Fig. 7 es un diagrama de flujo que explica un proceso de codificación.
La Fig. 8 es un diagrama que ilustra una configuración ilustrativa de una realización de un decodificador al que se ha aplicado una realización.
La Fig. 9 es un diagrama de flujo que explica un proceso de decodificación.
La Fig. 10 es un diagrama de flujo que explica un proceso de codificación.
La Fig. 11 es un diagrama de flujo que explica un proceso de decodificación.
La Fig. 12 es un diagrama de flujo que explica un proceso de codificación.
La Fig. 13 es un diagrama de flujo que explica un proceso de decodificación.
La Fig. 14 es un diagrama de bloques que ilustra una configuración ilustrativa de un ordenador.
Descripción de realizaciones
De aquí en adelante, se describirán las realizaciones con referencia a los dibujos.
Descripción general de la presente invención
En primer lugar, la expansión de banda de una señal de audio mediante SBR a la que se ha aplicado una realización se describirá con referencia a la Fig. 5. En este caso, en la Fig. 5, el eje horizontal indica la frecuencia y el eje vertical indica la energía de las respectivas frecuencias de una señal de audio. Además, las líneas discontinuas verticales en el dibujo representan los límites de las bandas del factor de escala.
Por ejemplo, supongamos que en el lado de decodificación de señales de audio, una señal SL11 de rango bajo y las energías Eobj1 a Eobj7 de banda del factor de escala de rango alto de las respectivas bandas Bobj1 a Bobj7 del factor de escala en el lado de rango alto se obtienen a partir de los datos recibidos desde el lado de codificación. Supongamos también que se usan la señal SL11 de rango bajo y las energías Eobj1 a Eobj7 de banda del factor de escala de rango alto, y se generan señales de rango alto de las respectivas bandas Bobj1 a Bobj7 del factor de escala.
Ahora consideremos que la señal SL11 de rango bajo y el componente de la banda Borg1 del factor de escala se usan para generar una señal de rango alto de la banda Bobj3 del factor de escala en el lado de rango alto.
En el ejemplo de la Fig. 5, el espectro de potencia de la señal SL11 de rango bajo está muy deprimido en el dibujo en la parte de la banda Borg1 del factor de escala. En otras palabras, la energía se ha vuelto pequeña en comparación con otras bandas. Por esta razón, si la SBR convencional genera una señal de rango alto en la banda Bobj3 del factor de escala, también se producirá una depresión en la señal de rango alto obtenida y se producirá una degradación auditiva en el audio.
Por consiguiente, en una realización, se lleva a cabo primero un proceso de aplanamiento (es decir, un proceso de suavizado) en el componente de la banda Borg1 del factor de escala de la señal SL11 de rango bajo. Por lo tanto, se obtiene una señal H11 de rango bajo de la banda Borg1 aplanada del factor de escala. El espectro de potencia de esta señal H11 de rango bajo se acopla suavemente a las partes de banda adyacentes a la banda Borg1 del factor de escala en el espectro de potencia de la señal SL11 de rango bajo. En otras palabras, la señal SL11 de rango bajo después del aplanamiento, es decir, del suavizado, se convierte en una señal en la que no se produce ninguna depresión en la banda Borg1 del factor de escala.
Al hacerlo, si se lleva a cabo el aplanamiento de la señal SL11 de rango bajo, la señal H11 de rango bajo obtenida mediante el aplanamiento cambia de frecuencia a la banda de la banda Bobj3 del factor de escala. La señal obtenida mediante el cambio de frecuencia se ajusta en ganancia y se considera una señal H12 de rango alto.
En este punto, el valor medio de las energías en cada subbanda de la señal H11 de rango bajo se calcula como la energía Eorg1 media de la banda Borg1 del factor de escala. A continuación, el ajuste en ganancia de la señal H11 de rango bajo cambiada de frecuencia se lleva a cabo según la relación entre la energía Eorg1 media y la energía Eobj3 de banda del factor de escala de rango alto. Más concretamente, el ajuste en ganancia se lleva a cabo de manera que el valor medio de las energías en las respectivas subbandas en la señal H11 de rango bajo cambiada de frecuencia pasa a ser casi de la misma magnitud que la energía Eobj3 de banda del factor de escala de rango alto. En la Fig. 5, dado que se usa una señal H11 de rango bajo sin depresión y se genera una señal H12 de rango alto, las energías de las respectivas subbandas en la señal H12 de rango alto han pasado a ser casi de la misma magnitud que la energía Eobj3 de banda del factor de escala de rango alto. Por consiguiente, se obtiene una señal de rango alto casi igual a una señal de rango alto en la señal original.
De esta manera, si se usa una señal de rango bajo aplanada para generar una señal de rango alto, los componentes de rango alto de una señal de audio se pueden generar con mayor precisión, y se puede mejorar la degradación auditiva convencional de una señal de audio producida por depresiones en el espectro de potencia de una señal de rango bajo. En otras palabras, es posible obtener audio de mayor calidad de audio.
Además, dado que las depresiones en el espectro de potencia pueden eliminarse si se aplana una señal de rango bajo, se puede evitar la degradación auditiva de una señal de audio si se usa una señal de rango bajo aplanada para generar una señal de rango alto, incluso en los casos en los que se llevan a cabo la limitación de ganancia y la interpolación.
En este caso, puede configurarse de manera que el aplanamiento de la señal de rango bajo se lleve a cabo en todos los componentes de banda del lado de rango bajo utilizados para generar señales de rango alto, o puede configurarse de manera que el aplanamiento de la señal de rango bajo se lleve a cabo solo en un componente de banda, entre los componentes de banda del lado de rango bajo, donde se produzca una depresión. Además, en el caso de que el aplanamiento se lleve a cabo solo en un componente de banda en el que se produzca una depresión, la banda sometida al aplanamiento puede ser una única subbanda si las subbandas son las bandas tomadas como unidades, o una banda de ancho arbitrario que consista en una pluralidad de subbandas.
Además, de aquí en adelante, para una banda del factor de escala u otra banda que consista en varias subbandas, el valor medio de las energías en las respectivas subbandas que constituyan esa banda también se denominará energía media de la banda.
A continuación, se describirán un codificador y un decodificador a los que se ha aplicado una realización. En la presente descripción, se describe a continuación a modo de ejemplo un caso en donde la generación de señales de alto rango se lleva a cabo tomando bandas del factor de escala como unidades, pero la generación de señales de alto rango también puede realizarse obviamente en bandas individuales que consistan en una o una pluralidad de subbandas.
Primera realización
<Configuración del codificador>
La Fig. 6 ilustra una configuración ilustrativa de una realización de un codificador.
Un codificador 11 consiste en un submuestreador 21, un circuito 22 de codificación de rango bajo, es decir, un circuito de codificación de rango de baja frecuencia, un procesador 23 de filtros de análisis QMF, un circuito 24 de codificación de rango alto, que es un circuito de codificación de rango de alta frecuencia, y un circuito 25 de multiplexación. Se suministra una señal de entrada, es decir, una señal de audio, al submuestreador 21 y al procesador 23 de filtros de análisis QMF del codificador 11.
Al submuestrear la señal de entrada suministrada, el submuestreador 21 extrae una señal de rango bajo, es decir, los componentes de rango bajo de la señal de entrada, y la suministra al circuito 22 de codificación de rango bajo. El circuito 22 de codificación de rango bajo codifica la señal de rango bajo suministrada desde el submuestreador 21 según un esquema de codificación dado, y suministra los datos codificados de rango bajo obtenidos como resultado al circuito 25 de multiplexación. El esquema de AAC, por ejemplo, sirve como método para codificar una señal de rango bajo.
El procesador 23 de filtros de análisis QMF lleva a cabo el procesamiento de filtros utilizando un filtro de análisis QMF en la señal de entrada suministrada y separa la señal de entrada en una pluralidad de subbandas. Por ejemplo, toda la banda de frecuencia de la señal de entrada se separa en 64 mediante un procesamiento de filtro, y se extraen los componentes de estas 64 bandas (subbandas). El procesador 23 de filtros de análisis QMF suministra las señales de las respectivas subbandas obtenidas mediante el procesamiento de filtros al circuito 24 de codificación de rango alto.
De forma adicional, de aquí en adelante, se considera que las señales de las respectivas subbandas de la señal de entrada también se deben denominar señales de subbanda. En particular, tomando las bandas de la señal de rango bajo extraída por el submuestreador 21 como el rango bajo, las señales de subbanda de las respectivas subbandas en el lado de rango bajo se denominan señales de subbanda de rango bajo, es decir, señales de banda de rango de baja frecuencia. Además, tomando las bandas de frecuencia más alta que las bandas en el lado de rango bajo de entre todas las bandas de la señal de entrada como el rango alto, se considera que las señales de subbanda de las subbandas en el lado de rango alto se deben denominar señales de subbanda de rango alto, es decir, señales de banda de rango de alta frecuencia.
Además, a continuación, continuará la descripción que toma bandas de frecuencia más alta que el rango bajo como el rango alto, pero también se puede hacer que una parte del rango bajo y el rango alto se superpongan. En otras palabras, puede configurarse de manera que se incluyan bandas compartidas mutuamente por el rango bajo y el rango alto.
El circuito 24 de codificación de rango alto genera información de SBR sobre la base de las señales de subbanda suministradas desde el procesador 23 de filtros de análisis QMF, y la suministra al circuito 25 de multiplexación. En la presente descripción, la información de SBR es información para obtener las energías de banda del factor de escala de rango alto de las respectivas bandas del factor de escala en el lado de rango alto de la señal de entrada, es decir, la señal original.
El circuito 25 de multiplexación multiplexa los datos codificados de rango bajo del circuito 22 de codificación de rango bajo y la información de SBR del circuito 24 de codificación de rango alto, y emite el flujo de bits obtenido mediante multiplexación.
<Descripción del proceso de codificación>
Mientras tanto, si se introduce una señal de entrada en el codificador 11 y se ordena la codificación de la señal de entrada, el codificador 11 lleva a cabo un proceso de codificación y lleva a cabo la codificación de la señal de entrada. De aquí en adelante, se describirá un procesamiento de codificación mediante el codificador 11 con referencia al diagrama de flujo de la Fig. 7.
En una etapa S11, el submuestreador 21 submuestrea una señal de entrada suministrada y extrae una señal de rango bajo, y la suministra al circuito 22 de codificación de rango bajo.
En una etapa S12, el circuito 22 de codificación de rango bajo codifica la señal de rango bajo suministrada desde el submuestreador 21 según el esquema de AAC, por ejemplo, y suministra los datos codificados de rango bajo obtenidos como resultado al circuito 25 de multiplexación.
En una etapa S13, el procesador 23 de filtros de análisis QMF lleva a cabo el procesamiento de filtros utilizando un filtro de análisis QMF en la señal de entrada suministrada, y suministra las señales de subbanda de las respectivas subbandas obtenidas como resultado al circuito 24 de codificación de rango alto.
En una etapa S14, el circuito 24 de codificación de rango alto calcula una energía Eobj de banda del factor de escala de rango alto, es decir, información de energía, para cada banda del factor de escala en el lado de rango alto, sobre la base de las señales de subbanda suministradas desde el procesador 23 de filtros de análisis QMF.
En otras palabras, el circuito 24 de codificación de rango alto toma una banda que consiste en varias subbandas consecutivas en el lado de rango alto como una banda del factor de escala, y usa las señales de subbanda de las respectivas subbandas dentro de la banda del factor de escala para calcular la energía de cada subbanda. A continuación, el circuito 24 de codificación de rango alto calcula el valor medio de las energías de cada subbanda dentro de la banda del factor de escala, y toma el valor medio calculado de las energías como la energía Eobj de banda del factor de escala de rango alto de esa banda del factor de escala. Por lo tanto, se calculan las energías de banda del factor de escala de rango alto, es decir, la información de energía, Eobj1 a Eobj7 en la Fig. 5, por ejemplo.
En una etapa S15, el circuito 24 de codificación de rango alto codifica las energías Eobj de banda del factor de escala de rango alto para una pluralidad de bandas del factor de escala, es decir, información de energía, según un esquema de codificación dado, y genera información de SBR. Por ejemplo, las energías Eobj de banda del factor de escala de rango alto se codifican según la cuantificación escalar, la codificación diferencial, la codificación de longitud variable u otro esquema. El circuito 24 de codificación de rango alto suministra la información de SBR obtenida mediante codificación al circuito 25 de multiplexación.
En una etapa S16, el circuito 25 de multiplexación multiplexa los datos codificados de rango bajo del circuito 22 de codificación de rango bajo y la información de SBR del circuito 24 de codificación de rango alto, y emite el flujo de bits obtenido mediante multiplexación. El proceso de codificación finaliza.
Al hacerlo, el codificador 11 codifica una señal de entrada y emite un flujo de bits multiplexado con datos codificados de rango bajo e información de SBR. Por consiguiente, en el lado receptor de este flujo de bits, los datos codificados de rango bajo se decodifican para obtener una señal de rango bajo, es decir, una señal de rango de baja frecuencia, mientras que, además, la señal de rango bajo y la información de SBR se usan para generar una señal de rango alto, es decir, una señal de rango de alta frecuencia. Se puede obtener una señal de audio de banda más ancha que consista en la señal de rango bajo y la señal de rango alto.
Configuración del decodificador
A continuación, se describirá un decodificador que recibe y decodifica una salida de flujo de bits del codificador 11 en la Fig. 6. El decodificador está configurado como se ilustra en la Fig. 8, por ejemplo.
En otras palabras, un decodificador 51 consiste en un circuito 61 de demultiplexación, un circuito 62 de decodificación de rango bajo, es decir, un circuito de decodificación de rango de baja frecuencia, un procesador 63 de filtros de análisis QMF, un circuito 64 de decodificación de rango alto, es decir, un circuito generador de rango de alta frecuencia y un procesador 65 de filtros de síntesis QMF, es decir, un circuito combinatorio.
El circuito 61 de demultiplexación demultiplexa un flujo de bits recibido desde el codificador 11 y extrae datos codificados de rango bajo e información de SBR. El circuito 61 de demultiplexación suministra los datos codificados de rango bajo obtenidos mediante demultiplexación al circuito 62 de decodificación de rango bajo, y suministra la información de SBR obtenida mediante demultiplexación al circuito 64 de decodificación de rango alto.
El circuito 62 de decodificación de rango bajo decodifica los datos codificados de rango bajo suministrados desde el circuito 61 de demultiplexación con un esquema de decodificación que corresponde al esquema de codificación de señales de rango bajo (por ejemplo, el esquema de AAC) usado por el codificador 11, y suministra la señal de rango bajo, es decir, la señal de rango de baja frecuencia, obtenida como resultado al procesador 63 de filtros de análisis QMF. El procesador 63 de filtros de análisis QMF lleva a cabo el procesamiento de filtros utilizando un filtro de análisis QMF en la señal de rango bajo suministrada desde el circuito 62 de decodificación de rango bajo, y extrae señales de subbanda de las respectivas subbandas en el lado de rango bajo desde la señal de rango bajo. En otras palabras, se lleva a cabo la separación de bandas de la señal de rango bajo. El procesador 63 de filtros de análisis QMF suministra las señales de subbanda de rango bajo, es decir, señales de banda de rango de baja frecuencia, de las respectivas subbandas en el lado de rango bajo que se obtuvieron mediante procesamiento de filtros al circuito 64 de decodificación de rango alto y al procesador 65 de filtros de síntesis QMF.
Usando la información de SBR suministrada desde el circuito 61 de demultiplexación y las señales de subbanda de rango bajo, es decir, señales de banda de rango de baja frecuencia, suministradas desde el procesador 63 de filtros de análisis QMF, el circuito 64 de decodificación de rango alto genera señales de rango alto para las respectivas bandas del factor de escala en el lado de rango alto y las suministra al procesador 65 de filtros de síntesis q Mf .
El procesador 65 de filtros de síntesis QMF sintetiza, es decir, combina, las señales de subbanda de rango bajo suministradas desde el procesador 63 de filtros de análisis QMF y las señales de rango alto suministradas desde el circuito 64 de decodificación de rango alto según el procesamiento de filtros usando un filtro de síntesis QMF, y genera una señal de salida. Esta señal de salida es una señal de audio que consiste en los respectivos componentes de subbanda de rango bajo y de rango alto, y se emite desde el procesador 65 de filtros de síntesis QMF a un altavoz posterior u otra unidad de reproducción.
Descripción del proceso de decodificación
Si se suministra un flujo de bits desde el codificador 11 al decodificador 51 ilustrado en la Fig. 8 y se ordena la decodificación del flujo de bits, el decodificador 51 lleva a cabo un proceso de decodificación y genera una señal de salida. De aquí en adelante, se describirá un proceso de decodificación mediante el decodificador 51 con referencia al diagrama de flujo de la Fig. 9.
En una etapa S41, el circuito 61 de demultiplexación demultiplexa el flujo de bits recibido desde el codificador 11. A continuación, el circuito 61 de demultiplexación suministra los datos codificados de rango bajo obtenidos mediante la demultiplexación del flujo de bits al circuito 62 de decodificación de rango bajo y, además, suministra información de SBR al circuito 64 de decodificación de rango alto.
En una etapa S42, el circuito 62 de decodificación de rango bajo decodifica los datos codificados de rango bajo suministrados desde el circuito 62 de decodificación de rango bajo, y suministra la señal de rango bajo, es decir, la señal de rango de baja frecuencia, obtenida como resultado al procesador 63 de filtros de análisis QMF.
En una etapa S43, el procesador 63 de filtros de análisis QMF lleva a cabo el procesamiento de filtros usando un filtro de análisis QMF en la señal de rango bajo suministrada desde el circuito 62 de decodificación de rango bajo. A continuación, el procesador 63 de filtros de análisis QMF suministra las señales de subbanda de rango bajo, es decir, señales de banda de rango de baja frecuencia, de las respectivas subbandas en el lado de rango bajo que se obtuvieron mediante procesamiento de filtros al circuito 64 de decodificación de rango alto y al procesador 65 de filtros de síntesis QMF.
En una etapa S44, el circuito 64 de decodificación de rango alto decodifica la información de SBR suministrada desde el circuito 62 de decodificación de rango bajo. Por lo tanto, se obtienen las energías Eobj de banda del factor de escala de rango alto, es decir, la información de energía, de las respectivas bandas del factor de escala en el lado de rango alto.
En una etapa S45, el circuito 64 de decodificación de rango alto lleva a cabo un proceso de aplanamiento, es decir, un proceso de suavizado, en las señales de subbanda de rango bajo suministradas desde el procesador 63 de filtros de análisis QMF.
Por ejemplo, para una banda del factor de escala particular en el lado de rango alto, el circuito 64 de decodificación de rango alto toma la banda del factor de escala en el lado de rango bajo que se usa para generar una señal de rango alto para esa banda del factor de escala como la banda del factor de escala objetivo para el proceso de aplanamiento. En este caso, se considera que las bandas del factor de escala en el rango bajo que se usan para generar señales de rango alto para las respectivas bandas del factor de escala en el lado de rango alto están determinadas de antemano.
A continuación, el circuito 64 de decodificación de rango alto lleva a cabo el procesamiento de filtros utilizando un filtro de aplanamiento en las señales de subbanda de rango bajo de las respectivas subbandas que constituyen la banda del factor de escala objetivo de procesamiento en el lado de rango bajo. Más concretamente, sobre la base de las señales de subbanda de rango bajo de las respectivas subbandas que constituyen la banda del factor de escala objetivo de procesamiento en el lado de rango bajo, el circuito 64 de decodificación de rango alto calcula las energías de esas subbandas y calcula el valor medio de las energías calculadas de las respectivas subbandas como la energía media. El circuito 64 de decodificación de rango alto aplana las señales de subbanda de rango bajo de las respectivas subbandas multiplicando las señales de subbanda de rango bajo de las respectivas subbandas que constituyen la banda del factor de escala objetivo de procesamiento por las relaciones entre las energías de esas subbandas y la energía media.
Por ejemplo, supongamos que la banda del factor de escala tomada como el objetivo de procesamiento consiste en las tres subbandas SB1 a SB3, y supongamos que las energías E1 a E3 se obtienen como las energías de esas subbandas. En este caso, el valor medio de las energías E1 a E3 de las subbandas SB1 a SB3 se calcula como la energía media EA.
A continuación, los valores de las relaciones de las energías, es decir, EA/E1, EA/E2 y EA/E3, se multiplican por las respectivas señales de subbanda de rango bajo de las subbandas SB1 a SB3. De esta manera, una señal de subbanda de rango bajo multiplicada por una relación de energía se considera una señal de subbanda de rango bajo aplanada.
En este caso, también puede configurarse de manera que las señales de subbanda de rango bajo se aplanen multiplicando la relación entre el valor máximo de las energías E1 a E3 y la energía de una subbanda por la señal de subbanda de rango bajo de esa subbanda. El aplanamiento de las señales de subbanda de rango bajo de las respectivas subbandas puede llevarse a cabo de cualquier manera siempre que el espectro de potencia de una banda del factor de escala que consista en esas subbandas esté aplanado.
Al hacerlo, para cada banda del factor de escala en el lado de rango alto que se pretende generar de ahora en adelante, las señales de subbanda de rango bajo de las respectivas subbandas que constituyen las bandas del factor de escala en el lado de rango bajo que se utilizan para generar esas bandas del factor de escala se aplanan.
En una etapa S46, para las respectivas bandas del factor de escala en el lado de rango bajo que se usan para generar bandas del factor de escala en el lado de rango alto, el circuito 64 de decodificación de rango alto calcula las energías medias Eorg de esas bandas del factor de escala.
Más concretamente, el circuito 64 de decodificación de rango alto calcula las energías de las respectivas subbandas usando las señales de subbanda de rango bajo aplanadas de las respectivas subbandas que constituyen una banda del factor de escala en el lado de rango bajo, y además calcula el valor medio de esas energías de subbanda como una energía media Eorg.
En una etapa S47, el circuito 64 de decodificación de rango alto cambia de frecuencia las señales de las respectivas bandas del factor de escala en el lado de rango bajo, es decir, señales de banda de rango de baja frecuencia, que se usan para generar bandas del factor de escala en el lado de rango alto, es decir, señales de banda de rango de alta frecuencia, a las bandas de frecuencia de las bandas del factor de escala en el lado de rango alto que se pretenden generar. En otras palabras, las señales de subbanda de rango bajo aplanadas de las respectivas subbandas que constituyen las bandas del factor de escala en el lado de rango bajo se cambian de frecuencia para generar señales de banda de rango de alta frecuencia.
En una etapa S48, el circuito 64 de decodificación de rango alto ajusta en ganancia las señales de subbanda de rango bajo cambiadas de frecuencia según las relaciones entre las energías Eobj de banda del factor de escala de rango alto y las energías medias Eorg, y genera señales de subbanda de rango alto para las bandas del factor de escala en el lado de rango alto.
Por ejemplo, supongamos que una banda del factor de escala en el rango alto que se pretende generar de ahora en adelante se denomina banda del factor de escala de rango alto, y que una banda del factor de escala en el lado de rango bajo que se usa para generar esa banda del factor de escala de rango alto se llama banda del factor de escala de rango bajo.
El circuito 64 de decodificación de rango alto ajusta en ganancia las señales de subbanda de rango bajo aplanadas de manera que el valor medio de las energías de las señales de subbanda de rango bajo cambiadas de frecuencia de las respectivas subbandas que constituyen la banda del factor de escala de rango bajo pasa a ser casi de la misma magnitud que la energía de banda del factor de escala de rango alto de la banda del factor de escala de rango alto.
Al hacerlo, las señales de subbanda de rango bajo cambiadas de frecuencia y ajustadas en ganancia se consideran señales de subbanda de rango alto para las respectivas subbandas de una banda del factor de escala de rango alto, y una señal que consiste en las señales de subbanda de rango alto de las respectivas subbandas de una banda del factor de escala en el lado de rango alto se considera una señal de banda del factor de escala en el lado de rango alto (señal de rango alto). El circuito 64 de decodificación de rango alto suministra las señales de rango alto generadas de las respectivas bandas del factor de escala en el lado de rango alto al procesador 65 de filtros de síntesis QMF.
En una etapa S49, el procesador 65 de filtros de síntesis QMF sintetiza, es decir, combina, las señales de subbanda de rango bajo suministradas desde el procesador 63 de filtros de análisis QMF y las señales de rango alto suministradas desde el circuito 64 de decodificación de rango alto según el procesamiento de filtros usando un filtro de síntesis QMF, y genera una señal de salida. A continuación, el procesador 65 de filtros de síntesis QMF emite la señal de salida generada y finaliza el proceso de decodificación.
Al hacerlo, el decodificador 51 aplana, es decir, suaviza, las señales de subbanda de rango bajo y usa las señales de subbanda de rango bajo aplanadas y la información de SBR para generar señales de rango alto para las respectivas bandas del factor de escala en el lado de rango alto. De esta manera, usando señales de subbanda de rango bajo aplanadas para generar señales de rango alto, se puede obtener fácilmente una señal de salida capaz de reproducir audio de mayor calidad.
En este caso, en lo expuesto anteriormente, todas las bandas en el lado de rango bajo se describen como aplanadas, es decir, suavizadas. Sin embargo, en el lado del decodificador 51, el aplanamiento también puede llevarse a cabo solo en una banda en la que se produzca una depresión entre el rango bajo. En tales casos, se usan señales de rango bajo en el decodificador 51, por ejemplo, y se detecta una banda de frecuencia en la que se produce una depresión.
Segunda realización
<Descripción del proceso de codificación>
Además, el codificador 11 también puede configurarse para generar información de posición de una banda en la que se produce una depresión en el rango bajo e información utilizada para aplanar esa banda, y emitir información de SBR que incluya esa información. En tales casos, el codificador 11 lleva a cabo el proceso de codificación ilustrado en la Fig. 10.
De aquí en adelante, se describirá un proceso de codificación con referencia al diagrama de flujo en la Fig. 10 para el caso de emisión de información de SBR que incluya información de posición, etc., de una banda en la que se produzca una depresión.
En este caso, dado que el procesamiento de la etapa S71 a la etapa S73 es similar al procesamiento de la etapa S11 a la etapa S13 en la Fig. 7, su descripción se omite o se reduce. Cuando se lleva a cabo el procesamiento en la etapa S73, las señales de subbanda de las respectivas subbandas se suministran al circuito 24 de codificación de rango alto.
En una etapa S74, el circuito 24 de codificación de rango alto detecta bandas con una depresión entre las bandas de frecuencia de rango bajo, sobre la base de las señales de subbanda de rango bajo de las subbandas en el lado de rango bajo que se suministraron desde el procesador 23 de filtros de análisis QMF.
Más concretamente, el circuito 24 de codificación de rango alto calcula la energía media EL, es decir, el valor medio de las energías de todo el rango bajo calculando el valor medio de las energías de las respectivas subbandas en el rango bajo, por ejemplo. A continuación, de entre las subbandas del rango bajo, el circuito 24 de codificación de rango alto detecta subbandas en donde el diferencial entre la energía media EL y la energía de subbanda es igual o mayor que un valor umbral predeterminado. En otras palabras, se detectan subbandas para las que el valor obtenido restando la energía de la subbanda de la energía media EL es igual o mayor que un valor umbral.
Además, el circuito 24 de codificación de rango alto toma una banda que consiste en las subbandas descritas anteriormente para las que el diferencial pasa a ser igual o mayor que un valor umbral, siendo también una banda que consiste en varias subbandas consecutivas, como una banda con una depresión (denominada de aquí en adelante banda aplanada). En este caso, también puede haber casos en los que una banda aplanada sea una banda que consiste en una subbanda.
En una etapa S75, el circuito 24 de codificación de rango alto calcula, para cada banda aplanada, la información de posición de aplanamiento que indica la posición de una banda aplanada y la información de ganancia de aplanamiento utilizada para aplanar esa banda aplanada. El circuito de codificación de alto rango 24 toma la información que consiste en la información de posición aplanada y la información de ganancia de aplanamiento para cada banda aplanada como información de aplanamiento.
Más concretamente, el circuito 24 de codificación de rango alto toma la información que indica que se considera que una banda es una banda aplanada como información de posición de aplanamiento. Además, el circuito 24 de codificación de rango alto calcula, para cada subbanda que constituye una banda aplanada, el diferencial DE entre la energía media EL y la energía de esa subbanda, y toma la información que consiste en el diferencial DE de cada subbanda que constituye una banda aplanada como información de ganancia de aplanamiento.
En una etapa S76, el circuito 24 de codificación de rango alto calcula las energías Eobj de banda del factor de escala de rango alto de las respectivas bandas del factor de escala en el lado de rango alto, sobre la base de las señales de subbanda suministradas desde el procesador 23 de filtros de análisis QMF. En este caso, en la etapa S76, se lleva a cabo un procesamiento similar al de la etapa S14 en la Fig. 7.
En una etapa S77, el circuito 24 de codificación de rango alto codifica las energías Eobj de banda del factor de escala de rango alto de las respectivas bandas del factor de escala en el lado de rango alto y la información de aplanamiento de las respectivas bandas aplanadas según un esquema de codificación tal como la cuantificación escalar, y genera información de SBR. El circuito 24 de codificación de rango alto suministra la información de SBR generada al circuito 25 de multiplexación.
Después, se lleva a cabo el procesamiento en una etapa S78 y finaliza el proceso de codificación, pero dado que el procesamiento en la etapa S78 es similar al procesamiento en la etapa S16 en la Fig. 7, su descripción se omite o se reduce.
Al hacerlo, el codificador 11 detecta bandas aplanadas del rango bajo y emite información de SBR que incluye información de aplanamiento utilizada para aplanar las respectivas bandas aplanadas junto con los datos codificados de rango bajo. Por lo tanto, en el lado del decodificador 51, es posible llevar a cabo más fácilmente el aplanamiento de las bandas aplanadas.
<Descripción del proceso de decodificación>
Además, si un flujo de bits emitido por el proceso de codificación descrito con referencia al diagrama de flujo en la Fig. 10 se transmite al decodificador 51, el decodificador 51 que recibió ese flujo de bits lleva a cabo el proceso de decodificación ilustrado en la Fig. 11. De aquí en adelante, se describirá un proceso de decodificación mediante el decodificador 51 con referencia al diagrama de flujo en la Fig. 11.
En este caso, dado que el procesamiento de la etapa S101 a la etapa S104 es similar al procesamiento de la etapa S41 a la etapa S44 en la Fig. 9, su descripción se omite o se reduce. Sin embargo, en el procesamiento de la etapa S104, las energías Eobj de banda del factor de escala de rango alto y la información de aplanamiento de las respectivas bandas aplanadas se obtienen mediante la decodificación de la información de SBR.
En una etapa S105, el circuito de decodificación de alto rango 64 usa la información de aplanamiento para aplanar las bandas de aplanamiento indicadas por la información de posición de aplanamiento incluida en la información de aplanamiento. En otras palabras, el circuito 64 de decodificación de rango alto lleva a cabo el aplanamiento añadiendo el diferencial DE de una subbanda a la señal de subbanda de rango bajo de esa subbanda que constituye una banda aplanada indicada por la información de posición de aplanamiento. En este caso, el diferencial DE para cada subbanda de una banda aplanada es información incluida en la información de aplanamiento como información de ganancia de aplanamiento.
Al hacerlo, las señales de subbanda de rango bajo de la respectiva subbanda que constituye una banda aplanada entre las subbandas en el lado de rango bajo se aplanan. Después, se usan las señales de subbanda de rango bajo aplanadas, se lleva a cabo el procesamiento de la etapa S106 a la etapa S109 y finaliza el proceso de decodificación. En este caso, dado que este procesamiento de la etapa S106 a la etapa S109 es similar al procesamiento de la etapa S46 a la etapa S49 en la Fig. 9, su descripción se omite o se reduce.
Al hacerlo, el decodificador 51 usa información de aplanamiento incluida en la información de SBR, lleva a cabo el aplanamiento de bandas aplanadas y genera señales de rango alto para las respectivas bandas del factor de escala en el lado de rango alto. Al llevar a cabo el aplanamiento de las bandas aplanadas utilizando información de aplanamiento de esta manera, las señales de rango alto se pueden generar con mayor facilidad y rapidez.
Tercera realización
<Descripción del proceso de codificación>
Además, en la segunda realización, la información de aplanamiento se describe como incluida en la información de SBR tal cual y se transmite al decodificador 51. Sin embargo, también puede configurarse de manera que la información de aplanamiento se cuantifique vectorialmente y se incluya en la información de SBR.
En tales casos, el circuito 24 de codificación de rango alto del codificador 11 registra una tabla de posiciones en la que están asociados una pluralidad de vectores de información de posición de aplanamiento, es decir, información de posición de suavización, e índices de posición que especifican esos vectores de información de posición de aplanamiento, por ejemplo. En este caso, un vector de posición de información de aplanamiento es un vector que toma la respectiva información de posición de aplanamiento de una o una pluralidad de bandas aplanadas como sus elementos, y es un vector obtenido colocando esa información de posición de aplanamiento en orden desde la frecuencia de banda aplanada más baja.
En este caso, no solo se registran en la tabla de posiciones vectores de información de posición de aplanamiento diferentes entre sí que consisten en el mismo número de elementos, sino también una pluralidad de vectores de información de posición de aplanamiento que consisten en números diferentes entre sí de elementos.
Además, el circuito 24 de codificación de rango alto del codificador 11 registra una tabla de ganancias en la que están asociados una pluralidad de vectores de información de ganancia de aplanamiento e índices de ganancia que especifican esos vectores de información de ganancia de aplanamiento. En este caso, un vector de información de ganancia de aplanamiento es un vector que toma la respectiva información de ganancia de aplanamiento de una o una pluralidad de bandas aplanadas como sus elementos, y es un vector obtenido colocando esa información de ganancia de aplanamiento en orden desde la frecuencia de banda aplanada más baja.
De manera similar al caso de la tabla de posiciones, no solo se registran en la tabla de ganancias una pluralidad de vectores de información de ganancia de aplanamiento diferentes entre sí que consisten en el mismo número de elementos, sino también una pluralidad de vectores de información de ganancia de aplanamiento que consisten en números diferentes entre sí de elementos.
En el caso de que una tabla de posiciones y una tabla de ganancias se registren en el codificador 11 de esta manera, el codificador 11 lleva a cabo el proceso de codificación ilustrado en la Fig. 12. De aquí en adelante, se describirá un proceso de codificación mediante el codificador 11 con referencia al diagrama de flujo de la Fig. 12.
En este caso, dado que el respectivo procesamiento de la etapa S141 a la etapa S145 es similar al respectivo de la etapa S71 a la etapa S75 en la Fig. 10, su descripción se omite o se reduce.
Si se lleva a cabo el procesamiento en una etapa S145, se obtiene información de posición de aplanamiento e información de ganancia de aplanamiento para las respectivas bandas de aplanamiento en el rango bajo de una señal de entrada. A continuación, el circuito 24 de codificación de alto rango coloca la información de posición aplanada de las respectivas bandas aplanadas en orden de banda de frecuencia más baja y la toma como un vector de información de posición aplanada, mientras que, además, ordena la información de ganancia aplanada de las respectivas bandas aplanadas en orden de banda de frecuencia más baja y la toma como un vector de información de ganancia aplanado.
En una etapa S146, el circuito 24 de codificación de rango alto adquiere un índice de posición y un índice de ganancia correspondientes al vector de información de posición de aplanamiento y al vector de información de ganancia de aplanamiento obtenidos.
En otras palabras, de entre los vectores de información de posición de aplanamiento registrados en la tabla de posiciones, el circuito 24 de codificación de rango alto especifica el vector de información de posición de aplanamiento con la distancia euclidiana más corta al vector de información de posición de aplanamiento obtenido en la etapa S145. A continuación, a partir de la tabla de posiciones, el circuito 24 de codificación de rango alto adquiere el índice de posición asociado al vector de información de posición de aplanamiento especificado.
De manera similar, de entre los vectores de información de ganancia de aplanamiento registrados en la tabla de ganancias, el circuito 24 de codificación de rango alto especifica el vector de información de ganancia de aplanamiento con la distancia euclidiana más corta al vector de información de ganancia de aplanamiento obtenido en la etapa S145. A continuación, a partir de la tabla de ganancias, el circuito 24 de codificación de rango alto adquiere el índice de ganancia asociado al vector de información de ganancia de aplanamiento especificado.
Al hacerlo, si se adquieren un índice de posición y un índice de ganancia, el procesamiento en una etapa S147 se lleva a cabo posteriormente y se calculan las energías Eobj de banda del factor de escala de rango alto para las respectivas bandas del factor de escala en el lado de rango alto. En este caso, dado que el procesamiento en la etapa S147 es similar al procesamiento en la etapa S76 en la Fig. 10, su descripción se omite o se reduce.
En una etapa S148, el circuito 24 de codificación de rango alto codifica las respectivas energías Eobj de banda del factor de escala de rango alto, así como el índice de posición y el índice de ganancia adquiridos en la etapa S146 según un esquema de codificación tal como la cuantificación escalar, y genera información de SBR. El circuito 24 de codificación de rango alto suministra la información de SBR generada al circuito 25 de multiplexación.
Después, se lleva a cabo el procesamiento en una etapa S149 y finaliza el proceso de codificación, pero dado que el procesamiento en la etapa S149 es similar al procesamiento en la etapa S78 en la Fig. 10, su descripción se omite o se reduce.
Al hacerlo, el codificador 11 detecta bandas aplanadas del rango bajo y emite información de SBR que incluye un índice de posición y un índice de ganancia para obtener información de aplanamiento utilizada para aplanar las respectivas bandas aplanadas junto con los datos codificados de rango bajo. Por lo tanto, se puede reducir la cantidad de información en un flujo de bits emitido desde el codificador 11.
<Descripción del proceso de decodificación>
Además, en el caso de que se incluyan un índice de posición y un índice de ganancia en la información de SBR, una tabla de posiciones y una tabla de ganancias se registran por adelantado en el circuito 64 de decodificación de rango alto del decodificador 51.
De esta manera, en el caso de que el decodificador 51 registre una tabla de posiciones y una tabla de ganancias, el decodificador 51 lleva a cabo el proceso de decodificación ilustrado en la Fig. 13. De aquí en adelante, se describirá un proceso de decodificación mediante el decodificador 51 con referencia al diagrama de flujo en la Fig. 13.
En este caso, dado que el procesamiento de la etapa S171 a la etapa S174 es similar al procesamiento de la etapa S101 a la etapa S104 en la Fig. 11, su descripción se omite o se reduce. Sin embargo, en el procesamiento de la etapa S174, se obtienen energías Eobj de banda del factor de escala de rango alto, así como un índice de posición y un índice de ganancia mediante la decodificación de la información de SBR.
En una etapa S175, el circuito 64 de decodificación de rango alto adquiere un vector de información de posición de aplanamiento y un vector de información de ganancia de aplanamiento sobre la base del índice de posición y el índice de ganancia.
En otras palabras, el circuito 64 de decodificación de rango alto adquiere de la tabla de posiciones registradas el vector de información de posición de aplanamiento asociado al índice de posición obtenido mediante decodificación, y adquiere de la tabla de ganancias el vector de información de ganancia de aplanamiento asociado al índice de ganancia obtenido mediante decodificación. A partir del vector de información de posición de aplanamiento y del vector de información de ganancia de aplanamiento obtenidos de esta manera, se obtiene la información de aplanamiento de las respectivas bandas aplanadas, es decir, la información de posición de aplanamiento y la información de ganancia de aplanamiento de las respectivas bandas aplanadas.
Si se obtiene la información de aplanamiento de las respectivas bandas aplanadas, se lleva a cabo a continuación el procesamiento de la etapa S176 a la etapa S180 y finaliza el proceso de decodificación, pero dado que este procesamiento es similar al procesamiento de la etapa S105 a la etapa S109 en la Fig. 11, su descripción se omite o se reduce.
Al hacerlo, el decodificador 51 lleva a cabo el aplanamiento de las bandas aplanadas obteniendo información de aplanamiento de las respectivas bandas aplanadas a partir de un índice de posición y un índice de ganancia incluidos en la información de SBR, y genera señales de rango alto para las respectivas bandas del factor de escala en el lado de rango alto. Al obtener información de aplanamiento a partir de un índice de posición y un índice de ganancia de esta manera, se puede reducir la cantidad de información en un flujo de bits recibido.
La serie de procesos descrita anteriormente puede ejecutarse mediante hardware o ejecutarse mediante software. En el caso de ejecutar la serie de procesos mediante software, un programa que constituye este software se instala desde un medio de grabación de programas en un ordenador integrado en un hardware para usos especiales o, alternativamente, en, por ejemplo, un ordenador personal de uso general, etc., capaz de ejecutar diversas funciones mediante la instalación de varios programas.
La Fig. 14 es un diagrama de bloques que ilustra una configuración ilustrativa de hardware de un ordenador que ejecuta mediante un programa la serie de procesos descrita anteriormente.
En un ordenador, una CPU (Unidad Central de Procesamiento) 201, una ROM (Memoria de Solo Lectura) 202 y una RAM (Memoria de Acceso Aleatorio) 203 están acopladas entre sí mediante un bus 204.
De forma adicional, una interfaz 205 de entrada/salida está acoplada al bus 204. A la interfaz 205 de entrada/salida están acoplados una unidad 206 de entrada que consiste en un teclado, un ratón, un micrófono, etc., una unidad 207 de salida que consiste en una pantalla, altavoces, etc., una unidad 208 de grabación que consiste en un disco duro, una memoria no volátil, etc., una unidad 209 de comunicación que consiste en una interfaz de red, etc., y una unidad 210 que controla un medio extraíble 211 tal como un disco magnético, un disco óptico, un disco magneto-óptico o una memoria semiconductora.
En un ordenador configurado como el anterior, la serie de procesos descrita anteriormente se lleva a cabo debido a que la CPU 201 carga un programa grabado en la unidad 208 de grabación en la RAM 203 a través de la interfaz 205 de entrada/salida y el bus 204 y ejecuta el programa, por ejemplo.
El programa ejecutado por el ordenador (CPU 201) está grabado, por ejemplo, en el medio extraíble 211, que son medios empaquetados que consisten en discos magnéticos (incluidos discos flexibles), discos ópticos (CD-ROM (Disco Compacto de Memoria de Solo Lectura), DVD (Disco Versátil Digital), etc.), discos magneto-ópticos o una memoria semiconductora, etc. Alternativamente, se proporciona el programa a través de un medio de transmisión por cable o inalámbrico tal como una red de área local, Internet o una difusión de satélite digital.
De forma adicional, el programa se puede instalar en la unidad 208 de grabación a través de la interfaz 205 de entrada/salida cargando el medio extraíble 211 de grabación en la unidad 210. Además, el programa puede recibirse en la unidad 209 de comunicación a través de un medio de transmisión por cable o inalámbrico e instalarse en la unidad 208 de grabación. De otro modo, el programa puede instalarse previamente en la ROM 202 o en la unidad 208 de grabación.
En este caso, un programa ejecutado por un ordenador puede ser un programa en donde los procesos se lleven a cabo en una serie temporal siguiendo el orden descrito en la presente memoria descriptiva, o un programa en donde los procesos se lleven a cabo en paralelo o en los tiempos requeridos, tal como cuando se realiza una llamada.Lista de signos de referencia
11 codificador
22 circuito de codificación de rango bajo, es decir, un circuito de codificación de rango de baja frecuencia; 24 circuito de codificación de rango alto, es decir, un circuito de codificación de rango de alta frecuencia 25 circuito de multiplexación
51 decodificador
61 circuito de demultiplexación
63 procesador de filtros de análisis QMF
64 circuito de decodificación de rango alto, es decir, un circuito generador de rango de alta frecuencia 65 procesador de filtros de síntesis QMF, es decir, un circuito combinatorio

Claims (1)

  1. REIVINDICACIONES
    Un método implementado por ordenador para procesar una señal de audio, comprendiendo el método:
    recibir una señal codificada de rango de baja frecuencia correspondiente a la señal de audio; decodificar la señal codificada para producir una señal decodificada que tiene un espectro de energía de una forma que incluye una depresión de energía;
    realizar un procesamiento de filtros en la señal decodificada, separando el procesamiento de filtros la señal decodificada en señales de banda de rango de baja frecuencia;
    realizar un proceso de suavizado en las señales de banda de rango de baja frecuencia, suavizando el proceso de suavizado la depresión de energía de las señales de banda de rango de baja frecuencia;
    realizar un cambio de frecuencia en las señales de banda de rango de baja frecuencia suavizadas, generando el cambio de frecuencia señales de banda de rango de alta frecuencia a partir de las señales de banda de rango de baja frecuencia;
    combinar las señales de banda de rango de baja frecuencia y las señales de banda de rango de alta frecuencia para generar una señal de salida; y
    emitir la señal de salida,
    en donde la realización del proceso de suavizado en las señales de banda de rango de baja frecuencia comprende, además:
    calcular una energía media de una pluralidad de señales de banda de rango de baja frecuencia;
    calcular una relación para una señal seleccionada de las señales de banda de rango de baja frecuencia calculando una relación entre la energía media de la pluralidad de señales de banda de rango de baja frecuencia y una energía para la señal de banda de rango de baja frecuencia seleccionada; y
    multiplicar la señal de banda de rango de baja frecuencia seleccionada por la relación calculada.
    Un dispositivo para procesar una señal de audio, comprendiendo el dispositivo:
    un circuito de decodificación de rango de baja frecuencia configurado para recibir una señal de rango de baja frecuencia codificada correspondiente a la señal de audio y decodificar la señal codificada para producir una señal decodificada que tiene un espectro de energía de una forma que incluye una depresión de energía;
    un procesador de filtros configurado para realizar un procesamiento de filtros en la señal decodificada, separando el procesamiento de filtros la señal decodificada en señales de banda de rango de baja frecuencia;
    un circuito generador de rango de alta frecuencia configurado para:
    realizar un proceso de suavizado en las señales de banda de rango de baja frecuencia, suavizando el proceso de suavizado la depresión de energía; y
    realizar un cambio de frecuencia en las señales de banda de rango de baja frecuencia suavizadas, generando el cambio de frecuencia señales de banda de rango de alta frecuencia a partir de las señales de banda de rango de baja frecuencia; y un circuito combinatorio configurado para combinar las señales de banda de rango de baja frecuencia y las señales de banda de rango de alta frecuencia para generar una señal de salida y emitir la señal de salida,
    en donde el circuito generador de rango de alta frecuencia está configurado además para realizar el proceso de suavizado en las señales de banda de rango de baja frecuencia al:
    calcular una energía media de una pluralidad de señales de banda de rango de baja frecuencia;
    calcular una relación para una señal seleccionada de las señales de banda de rango de baja frecuencia calculando una relación entre la energía media de la pluralidad de señales de banda de rango de baja frecuencia y una energía para la señal de banda de rango de baja frecuencia seleccionada; y
    multiplicar la señal de banda de rango de baja frecuencia seleccionada por la relación calculada.
    Un medio de grabación de programas informáticos que incluye instrucciones que, cuando son ejecutadas por un procesador, realizan un método para procesar una señal de audio, comprendiendo el método:
    recibir una señal codificada de rango de baja frecuencia correspondiente a la señal de audio; decodificar la señal codificada para producir una señal decodificada que tiene un espectro de energía de una forma que incluye una depresión de energía;
    realizar un procesamiento de filtros en la señal decodificada, separando el procesamiento de filtros la señal decodificada en señales de banda de rango de baja frecuencia;
    realizar un proceso de suavizado en las señales de banda de rango de baja frecuencia, suavizando el proceso de suavizado la depresión de energía de la señal decodificada; realizar un cambio de frecuencia en las señales de banda de rango de baja frecuencia suavizadas, generando el cambio de frecuencia señales de banda de rango de alta frecuencia a partir de las señales de banda de rango de baja frecuencia;
    combinar las señales de banda de rango de baja frecuencia y las señales de banda de rango de alta frecuencia para generar una señal de salida; y
    emitir la señal de salida,
    en donde la realización del proceso de suavizado en las señales de banda de rango de baja frecuencia comprende, además:
    calcular una energía media de una pluralidad de señales de banda de rango de baja frecuencia;
    calcular una relación para una señal seleccionada de las señales de banda de rango de baja frecuencia calculando una relación entre la energía media de la pluralidad de señales de banda de rango de baja frecuencia y una energía para la señal de banda de rango de baja frecuencia seleccionada; y
    multiplicar la señal de banda de rango de baja frecuencia seleccionada por la relación calculada.
ES22167951T 2010-08-03 2011-07-27 Signal processing apparatus and method, and program Active ES3020522T3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010174758A JP6075743B2 (ja) 2010-08-03 2010-08-03 信号処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
ES3020522T3 true ES3020522T3 (en) 2025-05-22

Family

ID=45559144

Family Applications (1)

Application Number Title Priority Date Filing Date
ES22167951T Active ES3020522T3 (en) 2010-08-03 2011-07-27 Signal processing apparatus and method, and program

Country Status (17)

Country Link
US (4) US9406306B2 (es)
EP (5) EP2471063B1 (es)
JP (1) JP6075743B2 (es)
KR (3) KR101835156B1 (es)
CN (2) CN102549658B (es)
AR (1) AR082447A1 (es)
AU (4) AU2011287140A1 (es)
BR (1) BR112012007187B1 (es)
CA (1) CA2775314C (es)
CO (1) CO6531467A2 (es)
ES (1) ES3020522T3 (es)
MX (1) MX2012003661A (es)
RU (3) RU2550549C2 (es)
SG (1) SG10201500267UA (es)
TR (1) TR201809449T4 (es)
WO (1) WO2012017621A1 (es)
ZA (1) ZA201202197B (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2831875B1 (en) 2012-03-29 2015-12-16 Telefonaktiebolaget LM Ericsson (PUBL) Bandwidth extension of harmonic audio signal
BR112014004127A2 (pt) 2012-07-02 2017-04-04 Sony Corp dispositivo e método de decodificação, programa, e, dispositivo e método de codificação
RU2624104C2 (ru) * 2013-01-29 2017-06-30 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования расширенного по частоте сигнала, используя формирование сигнала расширения
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
MY190424A (en) * 2016-04-12 2022-04-21 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
CN112562703B (zh) * 2020-11-17 2024-07-26 普联国际有限公司 一种音频的高频优化方法、装置和介质

Family Cites Families (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6073100A (en) * 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1144179C (zh) * 1997-07-11 2004-03-31 索尼株式会社 声音信号解码方法和装置、声音信号编码方法和装置
WO2000013243A2 (de) * 1998-08-26 2000-03-09 Siemens Aktiengesellschaft Verbesserte gasdiffusionselektrode, herstellungsverfahren dazu und verfahren zur hydrophobierung einer gasdiffusionselektrode
GB2342548B (en) * 1998-10-02 2003-05-07 Central Research Lab Ltd Apparatus for,and method of,encoding a signal
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6829360B1 (en) * 1999-05-14 2004-12-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
FR2821501B1 (fr) * 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
MXPA03002115A (es) * 2001-07-13 2003-08-26 Matsushita Electric Industrial Co Ltd DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO.
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Industrial Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
WO2004008806A1 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
DE60304479T2 (de) * 2002-08-01 2006-12-14 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodekodierungsvorrichtung und audiodekodierungsverfahren auf der basis der spektralband duplikation
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100728428B1 (ko) * 2002-09-19 2007-06-13 마츠시타 덴끼 산교 가부시키가이샤 오디오 디코딩 장치 및 오디오 디코딩 방법
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
CN1748443B (zh) * 2003-03-04 2010-09-22 诺基亚有限公司 多声道音频扩展支持
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
CN1926607B (zh) * 2004-03-01 2011-07-06 杜比实验室特许公司 多信道音频编码
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
EP3118849B1 (en) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding device, decoding device, and method thereof
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
PL1810281T3 (pl) 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
ES2636443T3 (es) * 2005-04-01 2017-10-05 Qualcomm Incorporated Sistemas, procedimientos y aparatos para codificación de voz de banda ancha
KR100933548B1 (ko) * 2005-04-15 2009-12-23 돌비 스웨덴 에이비 비상관 신호의 시간적 엔벨로프 정형화
WO2007026821A1 (ja) * 2005-09-02 2007-03-08 Matsushita Electric Industrial Co., Ltd. エネルギー整形装置及びエネルギー整形方法
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Industrial Co., Ltd. aparelho de codificação de fala e método de codificação de fala
KR20080047443A (ko) * 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
WO2007063913A1 (ja) * 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. サブバンド符号化装置およびサブバンド符号化方法
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
DE602007013026D1 (de) * 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
WO2008032828A1 (en) * 2006-09-15 2008-03-20 Panasonic Corporation Audio encoding device and audio encoding method
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5141180B2 (ja) 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP4930320B2 (ja) 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US8041577B2 (en) * 2007-08-13 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for expanding audio signal bandwidth
JP5183741B2 (ja) * 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
PL3591650T3 (pl) * 2007-08-27 2021-07-05 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i urządzenie do wypełniania dziur widmowych
JP5409377B2 (ja) 2007-10-23 2014-02-05 クラリオン株式会社 高域補間装置および高域補間方法
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US20090132238A1 (en) * 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
BRPI0818927A2 (pt) * 2007-11-02 2015-06-16 Huawei Tech Co Ltd Método e aparelho para a decodificação de áudio
JP2009116275A (ja) * 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
EP2224432B1 (en) * 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR101221919B1 (ko) * 2008-03-03 2013-01-15 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
KR20090122142A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
MX2011000372A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Sintetizador de señales de audio y codificador de señales de audio.
EP2301027B1 (en) * 2008-07-11 2015-04-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for generating bandwidth extension output data
EP4407610B1 (en) * 2008-07-11 2025-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder
DK2320416T3 (da) * 2008-08-08 2014-05-26 Panasonic Corp Indretning til spektral udglatning, kodningsindretning, afkodningsindretning, kommunikationsterminalindretning, basisstationsindretning og fremgangsmåde til spektral udglatning
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
ES2901735T3 (es) * 2009-01-16 2022-03-23 Dolby Int Ab Transposición armónica mejorada de productos de cruce
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8392200B2 (en) 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI591625B (zh) 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
JP5223786B2 (ja) * 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
EP3570278B1 (en) 2010-03-09 2022-10-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. High frequency reconstruction of an input audio signal using cascaded filterbanks
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8793126B2 (en) * 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
RU2530254C2 (ru) * 2010-07-19 2014-10-10 Долби Интернешнл Аб Обработка звуковых сигналов в ходе высокочастотной реконструкции
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2012058358A (ja) * 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9230551B2 (en) * 2010-10-18 2016-01-05 Nokia Technologies Oy Audio encoder or decoder apparatus
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5845760B2 (ja) * 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
RU2584009C2 (ru) * 2011-09-29 2016-05-20 Долби Интернешнл Аб Обнаружение высокого качества в стереофонических радиосигналах с частотной модуляцией
US20150088528A1 (en) * 2012-04-13 2015-03-26 Sony Corporation Decoding apparatus and method, audio signal processing apparatus and method, and program
US9437198B2 (en) * 2012-07-02 2016-09-06 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
BR112014004127A2 (pt) * 2012-07-02 2017-04-04 Sony Corp dispositivo e método de decodificação, programa, e, dispositivo e método de codificação
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム

Also Published As

Publication number Publication date
CA2775314C (en) 2020-03-31
BR112012007187B1 (pt) 2020-12-15
KR101967122B1 (ko) 2019-04-08
HK1204133A1 (en) 2015-11-06
AU2020220212B2 (en) 2021-12-23
RU2550549C2 (ru) 2015-05-10
EP3340244B1 (en) 2019-09-04
US20160322057A1 (en) 2016-11-03
AU2016202800B2 (en) 2018-03-08
AU2018204110B2 (en) 2020-05-21
US20170337928A1 (en) 2017-11-23
KR20190037370A (ko) 2019-04-05
EP2471063A1 (en) 2012-07-04
JP6075743B2 (ja) 2017-02-08
EP4086901B1 (en) 2025-02-19
AU2020220212A1 (en) 2020-09-10
RU2765345C2 (ru) 2022-01-28
US20130124214A1 (en) 2013-05-16
US9406306B2 (en) 2016-08-02
KR20130107190A (ko) 2013-10-01
RU2018130363A3 (es) 2021-11-23
BR112012007187A2 (pt) 2016-03-29
WO2012017621A1 (en) 2012-02-09
RU2012111784A (ru) 2013-10-27
EP4086901A1 (en) 2022-11-09
AU2011287140A1 (en) 2012-04-19
EP3584793B1 (en) 2022-04-13
EP2471063A4 (en) 2014-01-22
AU2016202800A1 (en) 2016-05-26
MX2012003661A (es) 2012-04-30
TR201809449T4 (tr) 2018-07-23
CN102549658B (zh) 2014-08-27
HK1171858A1 (en) 2013-04-05
US9767814B2 (en) 2017-09-19
EP3584793A1 (en) 2019-12-25
RU2018130363A (ru) 2020-02-21
EP2471063B1 (en) 2018-04-04
AR082447A1 (es) 2012-12-05
CA2775314A1 (en) 2012-02-09
AU2018204110A1 (en) 2018-06-28
US20190164558A1 (en) 2019-05-30
KR20180026558A (ko) 2018-03-12
EP4478361A1 (en) 2024-12-18
RU2015110509A3 (es) 2018-06-27
RU2666291C2 (ru) 2018-09-06
ZA201202197B (en) 2012-11-28
JP2012037582A (ja) 2012-02-23
EP3340244A1 (en) 2018-06-27
EP4478361B1 (en) 2025-09-17
SG10201500267UA (en) 2015-03-30
CO6531467A2 (es) 2012-09-28
KR102057015B1 (ko) 2019-12-17
KR101835156B1 (ko) 2018-03-06
CN104200808A (zh) 2014-12-10
CN102549658A (zh) 2012-07-04
CN104200808B (zh) 2017-08-15
RU2015110509A (ru) 2016-10-20
US11011179B2 (en) 2021-05-18
US10229690B2 (en) 2019-03-12

Similar Documents

Publication Publication Date Title
ES3020522T3 (en) Signal processing apparatus and method, and program
ES2706148T3 (es) Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento de codificación de audio vocal, y procedimiento de decodificación de audio vocal
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
JP6210338B2 (ja) 信号処理装置および方法、並びにプログラム
HK1204133B (en) Signal processing apparatus and method
HK1171858B (en) Signal processing apparatus and method, and program