ES2261974T3 - Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. - Google Patents

Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.

Info

Publication number
ES2261974T3
ES2261974T3 ES03766661T ES03766661T ES2261974T3 ES 2261974 T3 ES2261974 T3 ES 2261974T3 ES 03766661 T ES03766661 T ES 03766661T ES 03766661 T ES03766661 T ES 03766661T ES 2261974 T3 ES2261974 T3 ES 2261974T3
Authority
ES
Spain
Prior art keywords
signal
band
sub
amplitude
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03766661T
Other languages
English (en)
Inventor
Mineo Tsushima
Naoya Tanaka
Takeshi Norimatsu
Kok Seng Chong
Kim Hann Kuah
Sua Hong Neo
Toshiyuki Nomura
Osamu Shimada
Yuichiro Takamizawa
Masahiro Serizawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Panasonic Holdings Corp
Original Assignee
NEC Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=31492144&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2261974(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by NEC Corp, Matsushita Electric Industrial Co Ltd filed Critical NEC Corp
Application granted granted Critical
Publication of ES2261974T3 publication Critical patent/ES2261974T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un aparato decodificador audio para decodificar una señal audio de un tren de bits (106) conteniendo información codificada acerca de una señal audio de banda estrecha (107) e información adicional (108, 109) para expandir la señal audio de banda estrecha a una señal audio de banda ancha, conteniendo la información adicional información de componente de alta frecuencia (108) que denota una característica de una banda de frecuencia más alta que una banda de la información codificada, e información de adición de sinusoide (109) que denota una señal sinusoidal añadida a una banda de frecuencia específica, incluyendo dicho aparato decodificador audio: un demultiplexor de tren de bits (101) operable para demultiplexar la información codificada y la información adicional del tren de bits; un decodificador (102) operable para decodificar la señal audio de banda estrecha de la información codificada demultiplexada; un filtro de sub-banda de análisis (103) operable para separar la señal audio de banda estrecha en una primera señal de sub-banda compuesta de una pluralidad de señales de sub-banda; un generador de señal sinusoidal (111) operable para generar una señal sinusoidal añadida a una sub-banda específica en una banda de frecuencia más alta que una banda de frecuencia de la información codificada en base a la información de adición de sinusoide en la información adicional demultiplexada; un generador de señal de corrección (114) operable para generar, en base a una característica de fase y una característica de amplitud de la señal sinusoidal, una señal de corrección añadida a sub-bandas cerca de una sub- banda específica para suprimir las señales de componente de solapamiento que se producen en las sub-bandas cerca de la sub-banda específica; un generador de señal de frecuencia alta (104) operable para generar una segunda señal de sub-banda compuesta de una pluralidad de señales de sub-banda en una banda de frecuencia más alta que la banda de frecuencia de la información codificada de la primera señal de sub-banda e información de componente de alta frecuencia en la información adicional demultiplexada, y añadir la señal sinusoidal y la señal de corrección a la segunda señal de sub-banda; y un filtro de síntesis de sub-banda de cálculo de valor real (105) operable para combinar la primera señal de sub-banda y la segunda señal de sub-banda para obtener la señal audio de banda ancha.

Description

Aparato decodificador y método de decodificación audio basado en una duplicación de banda espectral.
Campo técnico
La presente invención se refiere a un aparato decodificador y método de decodificación para un sistema de expansión de anchura de banda audio para generar una señal audio de banda ancha a partir de una señal audio de banda estrecha añadiendo información adicional conteniendo poca información, y se refiere a tecnología que permite que este sistema proporcione reproducción de alta calidad audio con pocos cálculos.
Antecedentes de la invención
Se conocen muchas tecnologías de codificación audio para codificar una señal audio a un tamaño de datos pequeño y después reproducir la señal audio del tren de bits codificado. La norma internacional ISO/IEC 13818-7 (MPEG-2 AAC) en particular se considera un método superior que permite la reproducción de alta calidad audio con un tamaño de código pequeño. Este método de codificación AAC se utiliza también en el sistema ISO/IEC 14496-3 (MPEG-4 Audio) más reciente.
Los métodos de codificación audio, tales como AAC, convierten una señal audio discreta del dominio de tiempo a una señal en el dominio de frecuencia muestreando la señal de dominio de tiempo a intervalos de tiempo específicos, dividiendo la información de frecuencia convertida en múltiples bandas de frecuencia, y codificando posteriormente la señal cuantificando cada una de las bandas de frecuencia en base a una distribución de datos apropiada. Para decodificación, la información de frecuencia es recreada a partir del flujo de códigos, y el sonido reproducido se obtiene convirtiendo la información de frecuencia a una señal de dominio de tiempo. Si la cantidad de información suministrada para codificación es pequeña (tal como en codificación a baja tasa de bits), el tamaño de datos asignado a cada una de las bandas de frecuencia segmentadas en el proceso de codificación disminuye, y, como resultado, algunas bandas de frecuencia pueden no contener información. En este caso, el proceso de decodificación produce reproducción audio sin sonido en el componente de frecuencia de la banda de frecuencia que no contiene información.
En general, dado que la sensibilidad al sonido con una frecuencia superior a aproximadamente 10 kHz es menor que a sonido a frecuencias más bajas, los datos de componente de alta frecuencia se eliminan generalmente para proporcionar reproducción audio de banda estrecha si el esquema de codificación audio distribuye información mediante un proceso basado en percepción auditiva humana.
Si se suministra datos a una tasa de bits de aproximadamente 96 kbps, incluso el método AAC puede codificar una señal estéreo de 44,1 kHz a una banda de aproximadamente 16 kHz, pero si los datos se codifican con datos suministrados a la mitad de esta tasa, es decir, 48 kbps, la anchura de banda que se puede cuantificar y codificar a la vez que se mantiene la calidad de sonido se reduce a lo sumo a aproximadamente 10 kHz. Además de ser de banda estrecha, el sonido reproducido codificado con una baja tasa de bits de 48 Kbps también suena poco nítido.
Un método que permite reproducción de banda ancha añadiendo una cantidad pequeña de información adicional a un flujo de códigos para reproducción audio de banda estrecha se describe, por ejemplo, en la Especificación del Sistema de Radio Digital Mundial (DRM) (ETSI TS 101 980) publicada por el Instituto Europeo de Normas de Telecomunicaciones (ETSI). Se describe tecnología similar denominada SBR (replicación de banda espectral), por ejemplo, en los documentos de convención de AES (Audio Engineering Society) 5553, 5559, 5560 (112ª Convención, 2002 mayo 1013, Munich, Alemania), especialmente el documento 5553 "Spectral Band Replication, a new approach in audio coding" de M. Dietz y otros.
La figura 2 es un diagrama esquemático de bloques de un ejemplo de un decodificador para expansión de banda usando SBR. El tren de bits de entrada 206 es separado por el demultiplexor de tren de bits 201 en información de componente de baja frecuencia 207, información de componente de alta frecuencia 208, e información de adición de onda sinusoidal 209. La información de componente de baja frecuencia 207 es, por ejemplo, información codificada usando el método de codificación MPEG-4 AAC u otro, y es decodificada por el decodificador de banda baja 202, por lo que se genera una señal de tiempo que representa el componente de baja frecuencia. Esta señal de tiempo que representa el componente de baja frecuencia es separada en múltiples (M) sub-bandas por el banco de filtros de análisis 203 e introducida en el generador de señal de frecuencia alta 204.
El generador de señal de frecuencia alta 204 compensa el componente de alta frecuencia perdido debido a limitación de anchura de banda copiando la señal de sub-banda de baja frecuencia que representa el componente de baja frecuencia a una sub-banda de alta frecuencia. La información de componente de alta frecuencia 208 introducida en el generador de señal de frecuencia alta 204 contiene información de ganancia para la sub-banda de alta frecuencia compensada de manera que la ganancia se regule para cada sub-banda de alta frecuencia generada.
Un generador de señal adicional 211 genera señal de inyección 212 por lo que se añade una onda sinusoidal de ganancia controlada a cada sub-banda de alta frecuencia. La señal de sub-banda de alta frecuencia generada por el generador de señal de frecuencia alta 204 es introducida después con la señal de sub-banda de baja frecuencia en el banco de filtros de síntesis 205 para síntesis de banda, y se genera la señal de salida 210. El recuento de sub-banda en el lado del banco de filtros de síntesis no tiene que ser el mismo que el número de sub-bandas en el lado del banco de filtros de análisis. Por ejemplo, si en la figura 2 N = 2M, la frecuencia de muestreo de la señal de salida será dos veces la frecuencia de muestreo de la señal de tiempo introducida en el banco de filtros de análi-
sis.
En esta configuración la información contenida en la información de componente de alta frecuencia 208 o información de adición de onda sinusoidal 209 se refiere solamente a control de ganancia, y, por lo tanto, la cantidad de información requerida es muy pequeña en comparación con la información de componente de baja frecuencia 207, que también contiene información espectral. Por lo tanto, este método es adecuado para codificar una señal de banda ancha a una tasa de bits baja.
El banco de filtros de síntesis 205 de la figura 2 se compone de filtros que toman tanto entrada de número real como entrada de número imaginario para cada sub-banda, y realizan un cálculo de valor complejo.
El decodificador configurado como antes para expansión de banda tiene dos filtros, el banco de filtros de análisis y el banco de filtros de síntesis, que realizan cálculos de valor complejo, y la decodificación requiere muchos cálculos. Un problema cuando el decodificador se construye para dispositivos LSI, por ejemplo, es que aumenta el consumo de potencia y disminuye el tiempo de reproducción que es posible con una capacidad dada de la fuente de alimentación. Dado que las señales que oímos en la salida del banco de filtros de síntesis son señales de número real, el banco de filtros de síntesis se puede configurar con bancos de filtro de número real para reducir los cálculos. Aunque esto reduce el número de cálculos, si se añade una onda sinusoidal usando el mismo método como cuando el banco de filtros de síntesis realiza cálculos de valor complejo, no se añade realmente una onda sinusoidal pura y no se logra el resultado previsto en el audio reproducido.
La presente invención reivindicada se dirige por lo tanto a resolver estos problemas de la técnica anterior, y proporciona un aparato y método de decodificación para un sistema de expansión de banda que opera con pocos cálculos utilizando un banco de filtros de cálculo de valor real por lo que la reproducción audio prevista se logra añadiendo un cambio ligero a una señal de generación de onda sinusoidal añadida tal como se introduciría en un banco de filtros de cálculo de valor complejo.
Con esta composición, se puede lograr reproducción audio de alta calidad a una baja tasa de bits usando pocos cálculos.
Breve descripción de los dibujos
La figura 1 es un diagrama esquemático de bloques que representa un ejemplo de un aparato decodificador audio según la presente invención.
La figura 2 muestra un ejemplo de la configuración de un aparato decodificador audio de la técnica anterior.
La figura 3 muestra un ejemplo de un generador de señal adicional para describir el principio de la presente invención.
La figura 4 muestra un ejemplo de un generador de señal adicional en una primera realización de la presente invención.
Las figuras 5A y 5B muestran un ejemplo de una señal de valor complejo inyectada.
La figura 6 muestra ejemplos de las señales de inyección generadas por el generador de señal adicional representado en la figura 3.
La figura 7 muestra solamente la parte de número real de las señales de inyección generadas por el generador de señal adicional representado en la figura 3.
La figura 8 muestra ejemplos de señales de inyección y señales de compensación generadas por el generador de señal adicional y el generador de señal de compensación representados en la figura 4.
La figura 9 es un diagrama de espectro para cuando se inyecta una onda sinusoidal solamente para la parte de valor real al filtro de síntesis de valor real.
La figura 10 es un diagrama de espectro para cuando se inyectan una onda sinusoidal solamente para la parte de valor real y una señal de compensación al filtro de síntesis de valor real.
La figura 11 muestra otro ejemplo de la señal de inyección y señal de compensación mostradas a modo de ejemplo en la figura 8.
La figura 12 muestra un ejemplo del generador de señal adicional en una segunda realización de la presente invención.
Y la figura 13 es un diagrama de bloques que representa el principio de la presente invención.
Mejor modo de llevar a la práctica la invención
La figura 13 es un diagrama de bloques que representa el principio de la presente invención. Las señales audio de música y otras contienen un componente de banda de frecuencia baja y un componente de banda de frecuencia alta. La información de señal audio codificada es transportada por el componente de banda de frecuencia baja, y la información de tono (información sinusoidal) y la información de ganancia son transportadas por el componente de banda de frecuencia alta. El receptor decodifica la señal audio del componente de banda de frecuencia baja, pero para el componente de banda de frecuencia alta, copia y procesa el componente de banda de frecuencia baja usando la información de tono e información de ganancia para sintetizar una señal pseudo-audio. La información de fase e información de amplitud son necesarias para sintetizar esta señal pseudo-audio, y la síntesis requiere así un cálculo de valor complejo. Dado que los cálculos de valor complejo requieren operaciones en las partes de número real y número imaginario, el proceso de cálculo es complejo y lento. Para simplificar este proceso de cálculo la presente invención opera usando solamente la parte de número real. Sin embargo, si los cálculos se realizan usando solamente la parte de valor real para algunas sub-bandas, aparecen señales de ruido en las sub-bandas más alta y más baja adyacentes. Se genera una señal de compensación para cancelar estas señales de ruido usando la información de fase, información de amplitud, e información de tiempo contenida en la información de tono.
Un aparato y método de decodificación audio según una realización preferida de la presente invención se describen a continuación con referencia a las figuras acompañantes.
Realización 1
La figura 1 es un diagrama esquemático que representa un aparato decodificador que realiza expansión de anchura de banda por medio de replicación de banda espectral (SBR) en base a una primera realización de la presente invención.
El tren de bits de entrada 106 es demultiplexado por el demultiplexor de tren de bits 101 en información de componente de baja frecuencia 107, información de componente de alta frecuencia 108, e información de adición de señal sinusoidal 109. La información de componente de baja frecuencia 107 es información que se codifica usando, por ejemplo, el método de codificación MPEG-4 AAC, es decodificada por el decodificador de baja frecuencia 102, y se genera una señal de tiempo que representa el componente de baja frecuencia. La señal de tiempo resultante que representa el componente de baja frecuencia es dividida después en múltiples (M) sub-bandas por el banco de filtros de análisis 103, e introducida en los medios de expansión de anchura de banda (generador de señal de frecuencia alta) 104. El generador de señal de frecuencia alta 104 copia la señal de sub-banda de baja frecuencia que representa el componente de baja frecuencia a una sub-banda de alta frecuencia para compensar el componente de alta frecuencia perdido por el límite de anchura de banda. La información de componente de alta frecuencia 108 introducida en el generador de señal de frecuencia alta 104 contiene información de ganancia para la sub-banda de alta frecuencia a generar, y la ganancia se regula para cada sub-banda de alta frecuencia generada.
El generador de señal adicional 111 produce señal de inyección 112 de manera que se añada una onda sinusoidal de ganancia controlada a cada sub-banda de alta frecuencia según la información de adición de señal sinusoidal (también llamada información de tono) 109. Las señales de sub-banda de alta frecuencia generadas por el generador de señal de frecuencia alta 104 se introducen con las señales de sub-banda de baja frecuencia al banco de filtros de síntesis 105 para síntesis de banda, dando lugar a la señal de salida 110. El número de sub-bandas en el banco de filtros de síntesis no tiene que coincidir con el número de sub-bandas en el lado del banco de filtros de análisis. Por ejemplo, si en la figura 1 N = 2M, la frecuencia de muestreo de la señal de salida será dos veces la frecuencia de muestreo de la señal de tiempo introducida en el banco de filtros de análisis.
El tren de bits de entrada 106 contiene información codificada de banda estrecha para la señal audio (es decir, información de componente de baja frecuencia 107) e información adicional para expandir esta señal de banda estrecha a una señal de banda ancha (es decir, información de componente de alta frecuencia 108 e información de adición de señal sinusoidal 109).
El banco de filtros de síntesis 105 del aparato decodificador representado en la figura 1 se compone de filtros de cálculo de valor real. También será obvio que se podría usar un filtro de cálculo de valor complejo que pueda llevar a cabo cálculos de valor real.
El aparato decodificador representado en la figura 1 también tiene un generador de señal de compensación 114 para generar una señal de compensación 113 para compensar la diferencia que resulta de la adición de señal sinusoidal.
El tren de bits de entrada 106 es demultiplexado por el demultiplexor de tren de bits 101 a información de componente de baja frecuencia 107, información de componente de alta frecuencia 108, e información de adición de señal sinusoidal 109.
La información de componente de baja frecuencia 107 es, por ejemplo, un tren de bits codificado MPEG-4 AAC, MPEG-1 Audio, o MPEG-2 Audio que es decodificado por un decodificador de baja frecuencia 102 que tiene una función de decodificación compatible, y se genera una señal de tiempo que representa el componente de baja frecuencia. La señal de tiempo resultante que representa el componente de baja frecuencia es dividida después en múltiples (M) primeras sub-bandas S1 por el banco de filtros de análisis 103, e introducida en el generador de señal de frecuencia alta 104. El banco de filtros de análisis 103 y el banco de filtros de síntesis 105 descritos más adelante se construyen a partir de un banco de filtros polifase o convertidor MDCT. Los bancos de filtros de división de banda son conocidos por los expertos en la técnica relacionada.
Las primeras señales de sub-banda S1 para el componente de señal de frecuencia baja del banco de filtros de análisis 103 son emitidas directamente por el generador de señal de frecuencia alta 104 y también enviadas a la parte de síntesis. La parte de generación de señal de frecuencia alta del generador de señal de frecuencia alta 104 recibe las primeras señales de sub-banda S1 y usando información de componente de alta frecuencia 108, la señal de inyección 112, y la señal de compensación 113 genera múltiples segundas señales de sub-banda S2. Las segundas señales de sub-banda S2 están a una banda de frecuencia más alta que las primeras señales de sub-banda S1. La información de componente de alta frecuencia 108 incluye información que indica que una de las primeras señales de sub-banda S1 va a ser copiada, y que se va a generar una de las segundas señales de sub-banda S2, y la información de control de ganancia que indica cuánto se deberá amplificar la primera señal de sub-banda S1 copiada.
Si no hay información de adición de señal sinusoidal 109 o no se genera señal realmente usando la información de adición de señal sinusoidal 109, el banco de filtros de síntesis 105 con N (donde N es mayor o igual a M) filtros de síntesis de sub-banda combina las señales de sub-banda de anchura de banda expandidas emitidas por el generador de señal de frecuencia alta 104 y el componente de señal de frecuencia baja del banco de filtros de análisis 103 para producir una señal de salida de banda ancha 110.
En esta primera realización de la invención el banco de filtros de síntesis 105 es un banco de filtros de cálculo de valor real. Es decir, el banco de filtros de síntesis 105 no usa entrada de número imaginario, solamente tiene una parte de número real introducida, y usa filtros que realizan cálculos de valor real. Por lo tanto, este banco de filtros de síntesis 105 es más simple y opera más rápidamente que un filtro que opera con cálculos de valor complejo.
Si hay información de adición de señal sinusoidal 109, la información de adición de señal sinusoidal 109 se introduce en el generador de señal adicional 111 por lo que se genera una señal de inyección 112, y añade a la señal de salida de generador de señal de frecuencia alta 104. La información de adición de señal sinusoidal 109 también es introducida en el generador de señal de compensación 114 por lo que se produce una señal de compensación 113, y se añade igualmente a la señal de salida del generador de señal de frecuencia alta 104.
La señal de salida de generador de señal de frecuencia alta 104 se introduce en el banco de filtros de síntesis 105. El banco de filtros de síntesis 105 envía la señal de salida 110 independientemente de si hay una señal añadida en base a información de adición de señal sinusoidal 109.
La generación de la señal de inyección 112 y la señal de compensación 113 en base a información de adición de señal sinusoidal 109 se describe con más detalle a continuación utilizando las figuras 3 y 4.
La figura 3 muestra el generador de señal adicional 111 utilizado en el método de decodificación audio que describe el principio básico de la presente invención, y la figura 4 muestra el generador de señal adicional 111 y el generador de señal de compensación 114 en una primera realización de la presente invención.
El generador de señal adicional 111 se describe en primer lugar con referencia a la figura 3. La información contenida en la información de adición de señal sinusoidal 109 incluye información de número de sub-banda inyectada que denota a qué banco de filtros de síntesis se inyecta la onda sinusoidal, información de fase que denota la fase en la que comienza la señal sinusoidal inyectada, información de tiempo que denota el tiempo en el que comienza la señal sinusoidal inyectada, e información de amplitud que denota la amplitud de la señal sinusoidal inyectada.
Unos medios de extracción de información de sub-banda inyectada 406 extraen el número de sub-banda inyectado. Los medios de extracción de información de fase 402 determinan, en base a la información de fase si la información de fase se contiene en la información de adición de señal sinusoidal 109, la fase en la que comienza la señal sinusoidal inyectada. Si la información de fase no se contiene en la información de adición de señal sinusoidal 109, los medios de extracción de información de fase 402 determinan la fase en la que comienza la señal sinusoidal inyectada considerando la continuidad a la fase del período de tiempo anterior.
Unos medios de extracción de amplitud 403 extraen la información de amplitud. Unos medios de extracción de tiempo 404 ex-traen la información de tiempo que indica en qué tiempo iniciar la inyección de onda sinusoidal y en qué tiempo terminar la inyección cuando se inyecta una onda sinusoidal al banco de filtros de síntesis.
En base a la información de los medios de extracción de información de fase 402, los medios de extracción de amplitud 403, y los medios de extracción de tiempo 404, los medios de generación de sinusoide 405 generan la onda sinusoidal (señal de tono) a inyectar. Se deberá observar que la frecuencia de la onda sinusoidal generada se puede establecer deseablemente, por ejemplo, a la frecuencia central de la sub-banda o una frecuencia desplazada una desviación predeterminada de la frecuencia central. Además, la frecuencia podría estar preestablecida según el número de sub-banda de la sub-banda inyectada. Por ejemplo, una onda sinusoidal del límite de frecuencia superior o inferior de la sub-banda se podría generar según que el número de sub-banda sea impar o par. Se supone a continuación que se produce una onda sinusoidal con la frecuencia central de la sub-banda, es decir, se produce una señal periódica con cuatro períodos de muestreo de señal de sub-banda.
Los medios de inyección de onda sinusoidal 407 insertan la onda sinusoidal enviada por medios de generación de sinusoide 405 en la sub-banda de filtro de síntesis que coincide con el número adquirido por los medios de extracción de información de sub-banda inyectada 406. La señal de salida de los medios de inyección de onda sinusoidal 407 es la señal de inyección 112.
Considérese una señal de valor complejo con cuatro períodos y amplitud S inyectada a la sub-banda K como se representa en la tabla en la figura 6. Los valores denotados (a,b) en la tabla significan la señal de valor complejo a+jb donde j es un valor imaginario. Con referencia a la figura 5A, la señal introducida en la sub-banda K en la figura 6 es una señal periódica que cambia 501, 502, 503, 504 en la figura 5A debido a la relación entre la parte de valor real y la parte de valor imaginario.
Si, a diferencia de la presente invención, el banco de filtros de síntesis es un filtro que toma entrada de valor complejo y realiza cálculos de valor complejo, la señal de salida del sistema de decodificación obtenido por esta señal de inyección tiene un solo espectro de frecuencia y se inyecta la llamada onda sinusoidal pura. Sin embargo, si el banco de filtros de síntesis es un filtro que toma solamente entrada de valor real y realiza solamente cálculos de valor real como en la presente invención, una señal de número real no conteniendo la parte de número imaginario representada en la figura 6 se inyecta a la sub-banda K como se representa en la figura 7. Con esta señal de inyección, el sistema de decodificación que usa un filtro de síntesis que toma solamente valores reales, envía un solo espectro de frecuencia como se representa en la figura 9 (espectro 902 de la onda sinusoidal inyectado) y espectros indeseados en las bandas superior e inferior al espectro de onda sinusoidal (espectro no deseado 903). Esto es debido a que un filtro de síntesis que usa cálculo de valor real no puede eliminar por completo la fuga de espectro a sub-bandas adyacentes debido a las características de filtro, y estas fugas de espectro aparecen como componentes de solapamiento.
Previendo un generador de señal de compensación 114 como se representa en la figura 4 además del generador de señal adicional 111 representado en la figura 3 en un banco de filtros de síntesis que usa cálculo de valor real solamente con entrada de valor real, se puede extraer los componentes de espectro no deseados representados en la figura 9.
El generador de señal adicional 111 y el generador de señal de compensación 114 según la presente invención se describen a continuación con referencia a la figura 4. En la figura 4 la información de adición de señal sinusoidal 109, los medios de extracción de información de fase 402, los medios de extracción de amplitud 403, los medios de extracción de tiempo 404, los medios de generación de sinusoide 405, los medios de extracción de información de sub-banda inyectada 406, los medios de inyección de onda sinusoidal 407, y la señal de inyección 408 son los mismos que los descritos con referencia a la figura 3. Lo que difiere de la figura 3 es la adición de medios de determinación de información de sub-banda de compensación 409 y el generador de señal de compensación 410.
Los medios de determinación de información de sub-banda de compensación 409 determinan la sub-banda a compensar en base a la información obtenida por los medios de extracción de información de sub-banda inyectada 406 indicando el número del banco de filtros de síntesis al que se inyecta la onda sinusoidal. La sub-banda a compensar es una sub-banda cerca de la sub-banda a la que se inyecta la onda sinusoidal, y puede ser una sub-banda de alta frecuencia o sub-banda de baja frecuencia. La sub-banda de alta frecuencia y la sub-banda de baja frecuencia a compensar variarán según las características del banco de filtros de síntesis 105, pero aquí se supone que son las sub-bandas junto a la sub-banda de la onda sinusoidal inyectada. Por ejemplo, cuando la onda sinusoidal se inyecta a la sub-banda K, la sub-banda K+1 y la sub-banda K-1 son, respectivamente, la sub-banda de alta frecuencia y la sub-banda de baja frecuencia a compensar.
El generador de señal de compensación 410 genera una señal que cancela espectros de solapamiento en la sub-banda compensada en base a la salida de los medios de extracción de información de fase 402, los medios de extracción de amplitud 403, y los medios de extracción de tiempo 404, y envía esta señal como señal de compensación 113. Esta señal de compensación 113 se añade a la señal de entrada al banco de filtros de síntesis 105 de la misma manera que la señal de inyección 112. La amplitud S y fase de la señal de compensación 113 se ajustan para la sub-banda K-1 y la sub-banda K+1 como se representa en la tabla en la figura 8.
En la figura 8 Alfa y Beta son valores determinados según las características del banco de filtros de síntesis específico, y más específicamente se determinan con consideración a la cantidad de fuga de espectro a sub-bandas adyacentes en el banco de filtros.
Como se reconocerá por la figura 8, si se añade una señal sinusoidal a la sub-banda K, la amplitud de una señal sinusoidal de período de ciclo T es de amplitud S en el tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S en el tiempo 2T/4, y amplitud 0 en el tiempo 3T/4. Se aplica una señal de compensación a la sub-banda K-1 y la sub-banda K+1. En los dibujos, los tiempos 0, 1, 2 y 3 corresponden a los tiempos 0, 1T/4, 2T/4 y 3T/4, respectivamente.
La señal de compensación aplicada a la sub-banda K-1 tiene amplitud 0 en el tiempo 0, amplitud Alfa*S en el tiempo 1T/4, amplitud 0 en el tiempo 2T/4, y amplitud Beta*S en el tiempo 3T/4.
La señal de compensación aplicada a la sub-banda K+1 tiene amplitud 0 en el tiempo 0, amplitud Beta*S en el tiempo 1T/4, amplitud 0 en el tiempo 2T/4, y amplitud Alfa*S en el tiempo 3T/4.
La figura 10 es un gráfico de espectro para la onda sinusoidal inyectada por una realización preferida de esta invención. Como se verá por la figura 10, se suprime el componente de espectro no deseado 903 observado en la figura 9.
Introduciendo esta señal de compensación, c no se producen componentes de espectro no deseados aunque se inyecte una señal sinusoidal a un banco de filtros de valor real, y se puede inyectar una onda sinusoidal a una sub-banda deseada con cálculos mínimos.
La invención se ha descrito con referencia a una señal sinusoidal inyectada a la sub-banda K donde la fase inicial es 0 y la parte de valor real o la parte de valor imaginario pasa a 0 como se representa en la figura 5A. Como se representa en la figura 5B, sin embargo, la presente invención también se puede aplicar cuando la fase se desplaza \delta del estado representado en la figura 5A. La relación entre la señal de inyección y la señal de compensación en este caso puede ser expresada como se representa en la tabla en la figura 11, por ejemplo, donde S, P, y Q son valores determinados según las características del banco de filtros con consideración a la cantidad de fuga de espectro por el banco de filtros a sub-bandas adyacentes.
Además, para una sub-banda K a la que se inyecta la onda sinusoidal, se inyecta una señal de compensación a sub-bandas K-1 y K+1 adyacentes, pero las sub-bandas adyacentes distintas de K-1 y K+1 pueden precisar corrección dependiendo de las características del filtro de síntesis. En este caso, la señal de compensación se inyecta simplemente a las sub-bandas que necesitan corrección.
Realización 2
La figura 12 es un diagrama esquemático que representa un generador de señal adicional en una segunda realización de la presente invención. Este generador de señal adicional difiere del generador de señal adicional 111 representado en la figura 4 en que se introduce información interpolada 1201 calculada por los medios de generación de sinusoide 405 en el generador de señal de compensación 410 de manera que la señal de compensación 113 se calcule en base a la información interpolada 1201.
Los medios de generación de sinusoide 405 en la primera realización anterior ajustan la amplitud de la onda sinusoidal generada en base solamente a la información de amplitud de la trama corriente extraída por los medios de extracción de amplitud 403. Sin embargo, los medios de generación de sinusoide 405 de esta segunda realización interpolan la información de amplitud usando información de amplitud de tramas contiguas, y ajustan la amplitud de la onda sinusoidal generada en base a esta información de amplitud interpolada.
Dado que la amplitud de la onda sinusoidal generada cambia suavemente como resultado de este proceso, se puede mejorar la calidad de sonido observada de la señal de salida.
Dado que la amplitud de la onda sinusoidal generada se cambia por interpolación con esta configuración, la amplitud de la señal de compensación correspondiente también debe ser ajustada. Por lo tanto, la información interpolada enviada por los medios de generación de sinusoide 405 también se introduce en el generador de señal de compensación 410 para regular la amplitud de la señal de compensación 113 sincronizada a la amplitud variable interpolada de la onda sinusoidal.
Esta configuración de la invención puede calcular correctamente la señal de compensación y suprimir componentes de espectro no deseados incluso cuando se interpola la amplitud de la onda sinusoidal generada.
También será evidente que el proceso del aparato decodificador audio representado en la figura 1 también puede ser escrito en software usando un lenguaje de programación. Además, este programa de software se puede grabar y distribuir por un medio de grabación de datos.
Al utilizar un banco de filtros de síntesis que reduce el número de operaciones utilizando solamente cálculos de valor real, se puede suprimir componentes de espectro no deseados que acompañan a la adición de onda sinusoidal y se puede inyectar solamente la onda sinusoidal deseada inyectando una señal de compensación a la sub-banda de baja frecuencia o alta frecuencia de la sub-banda a la que se añade la onda sinusoidal.

Claims (14)

1. Un aparato decodificador audio para decodificar una señal audio de un tren de bits (106) conteniendo información codificada acerca de una señal audio de banda estrecha (107) e información adicional (108, 109) para expandir la señal audio de banda estrecha a una señal audio de banda ancha, conteniendo la información adicional información de componente de alta frecuencia (108) que denota una característica de una banda de frecuencia más alta que una banda de la información codificada, e información de adición de sinusoide (109) que denota una señal sinusoidal añadida a una banda de frecuencia específica, incluyendo dicho aparato decodificador audio:
un demultiplexor de tren de bits (101) operable para demultiplexar la información codificada y la información adicional del tren de bits;
un decodificador (102) operable para decodificar la señal audio de banda estrecha de la información codificada demultiplexada;
un filtro de sub-banda de análisis (103) operable para separar la señal audio de banda estrecha en una primera señal de sub-banda compuesta de una pluralidad de señales de sub-banda;
un generador de señal sinusoidal (111) operable para generar una señal sinusoidal añadida a una sub-banda específica en una banda de frecuencia más alta que una banda de frecuencia de la información codificada en base a la información de adición de sinusoide en la información adicional demultiplexada;
un generador de señal de corrección (114) operable para generar, en base a una característica de fase y una característica de amplitud de la señal sinusoidal, una señal de corrección añadida a sub-bandas cerca de una sub-banda específica para suprimir las señales de componente de solapamiento que se producen en las sub-bandas cerca de la sub-banda específica;
un generador de señal de frecuencia alta (104) operable para generar una segunda señal de sub-banda compuesta de una pluralidad de señales de sub-banda en una banda de frecuencia más alta que la banda de frecuencia de la información codificada de la primera señal de sub-banda e información de componente de alta frecuencia en la información adicional demultiplexada, y añadir la señal sinusoidal y la señal de corrección a la segunda señal de sub-banda; y
un filtro de síntesis de sub-banda de cálculo de valor real (105) operable para combinar la primera señal de sub-banda y la segunda señal de sub-banda para obtener la señal audio de banda ancha.
2. Un aparato decodificador audio según la reivindicación 1, donde las señales de componente de solapamiento contienen al menos componentes suprimidos después de la síntesis por un filtro de síntesis de sub-banda que realiza cálculos de valor complejos.
3. Un aparato decodificador audio según la reivindicación 1, donde la primera señal de sub-banda se compone de señal de sub-banda de baja frecuencia, y la segunda señal de sub-banda se compone de señales de sub-banda de alta frecuencia.
4. Un aparato decodificador audio según la reivindicación 1, donde la señal de corrección generada por el generador de señal de corrección suprime señales de componente de solapamiento producidas en una sub-banda junto a la sub-banda a la que se añade la señal sinusoidal.
5. Un aparato decodificador audio según la reivindicación 1, donde una amplitud de la señal de corrección generada por el generador de señal de corrección es ajustada sincrónicamente a la amplitud de la señal sinusoidal.
6. Un aparato decodificador audio según la reivindicación 4, donde, cuando la señal sinusoidal se añade a la sub-banda K, una señal sinusoidal de período T tiene amplitud S en el tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S en el tiempo 2T/4, y amplitud 0 en el tiempo 3T/4, y la señal de corrección se aplica a la sub-banda K-1 y la sub-banda K+1,
la señal de corrección aplicada a la sub-banda K-1 tiene amplitud 0 en el tiempo 0, amplitud Alfa*S en el tiempo 1T/4, amplitud 0 en el tiempo 2T/4, y amplitud Beta*S en el tiempo 3T/4, y
la señal de corrección aplicada a la sub-banda K+1 tiene amplitud 0 en el tiempo 0, amplitud Beta*S en el tiempo 1T/ 4, amplitud 0 en el tiempo 2T/4, y amplitud Alfa*S en el tiempo 3T/4,
donde Alfa y Beta son constantes.
7. Un método de decodificación audio para decodificar una señal audio de un tren de bits conteniendo información codificada acerca de una señal audio de banda estrecha e información adicional para expandir la señal audio de banda estrecha a una señal audio de banda ancha, y conteniendo la información adicional información de componente de alta frecuencia que denota una característica de una banda de frecuencia más alta que una banda de la información codificada, e información de adición de sinusoide que denota una señal sinusoidal añadida a una banda de frecuencia específica, incluyendo dicho método de decodificación audio:
demultiplexar la información codificada y la información adicional del tren de bits;
decodificar la señal audio de banda estrecha de la información codificada demultiplexada;
separar la señal audio de banda estrecha en una primera señal de sub-banda compuesta de una pluralidad de señales de sub-banda;
generar una señal sinusoidal añadida a una sub-banda específica en una banda de frecuencia más alta que una banda de frecuencia de la información codificada en base a la información de adición de sinusoide en la información adicional demultiplexada;
generar, en base a una característica de fase y una característica de amplitud de la señal sinusoidal, una señal de corrección añadida a sub-bandas cerca de una sub-banda específica para suprimir señales de componente de solapamiento que se producen en las sub-bandas cerca de la sub-banda específica;
generar una segunda señal de sub-banda compuesta de una pluralidad de señales de sub-banda en una banda de frecuencia más alta que la banda de frecuencia de la información codificada de la primera señal de sub-banda e información de componente de alta frecuencia en la información adicional demultiplexada, y añadir la señal sinusoidal y señal de corrección a la segunda señal de sub-banda; y
sintetizar la primera señal de sub-banda y la segunda señal de sub-banda usando un cálculo de valor real para obtener la señal audio de banda ancha.
8. Un método de decodificación audio según la reivindicación 7, donde las señales de componente de solapamiento contienen al menos componentes suprimidos después de la síntesis realizada usando cálculos de valor complejos.
9. Un método de decodificación audio según la reivindicación 7, donde la primera señal de sub-banda se compone de señales de sub-banda de baja frecuencia, y la segunda señal de sub-banda se compone de señales de sub-banda de alta frecuencia.
10. Un método de decodificación audio según la reivindicación 7, donde la señal de corrección generada suprime señales de componente de solapamiento producidas en una sub-banda junto a la sub-banda a la que se añade la señal sinusoidal.
11. Un método de decodificación audio según la reivindicación 7, donde una amplitud de la señal de corrección generada es ajustada sincrónicamente a la amplitud de la señal sinusoidal.
12. Un método de decodificación audio según la reivindicación 10, donde cuando la señal sinusoidal se añade a la sub-banda K, una señal sinusoidal de período T tiene amplitud S en el tiempo 0, amplitud 0 en el tiempo 1T/4, amplitud -S en el tiempo 2T/4, y amplitud 0 en el tiempo 3T/4, y la señal de corrección se aplica a la sub-banda K-1 y la sub-banda K+1,
la señal de corrección aplicada a la sub-banda K-1 tiene amplitud 0 en el tiempo 0, amplitud Alfa*S en el tiempo 1T/ 4, amplitud 0 en el tiempo 2T/4, y amplitud Beta*S en el tiempo 3T/4, y
la señal de corrección aplicada a la sub-banda K+1 tiene amplitud 0 en el tiempo 0, amplitud Beta*S en el tiempo 1T/ 4, amplitud 0 en el tiempo 2T/4, y amplitud Alfa*S en el tiempo 3T/4,
donde Alfa y Beta son constantes.
13. Un programa incluyendo código ejecutable por ordenador operable para hacer que un ordenador efectúe el método de decodificación audio reivindicado en la reivindicación 7.
14. Un medio de grabación de datos legible por ordenador para grabar el programa según se reivindica en la reivindicación 13.
ES03766661T 2002-08-01 2003-07-30 Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. Expired - Lifetime ES2261974T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002225068 2002-08-01
JP2002-225068 2002-08-01

Publications (1)

Publication Number Publication Date
ES2261974T3 true ES2261974T3 (es) 2006-11-16

Family

ID=31492144

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03766661T Expired - Lifetime ES2261974T3 (es) 2002-08-01 2003-07-30 Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.

Country Status (14)

Country Link
US (1) US7058571B2 (es)
EP (1) EP1527442B1 (es)
JP (1) JP3646938B1 (es)
KR (1) KR100723753B1 (es)
CN (1) CN1286087C (es)
AT (1) ATE322735T1 (es)
AU (1) AU2003252727A1 (es)
BR (2) BRPI0305710B1 (es)
CA (1) CA2464408C (es)
DE (1) DE60304479T2 (es)
ES (1) ES2261974T3 (es)
HK (1) HK1073525A1 (es)
TW (1) TWI303410B (es)
WO (1) WO2004013841A1 (es)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE288617T1 (de) 2001-11-29 2005-02-15 Coding Tech Ab Wiederherstellung von hochfrequenzkomponenten
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
JP5224017B2 (ja) * 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
ES2358125T3 (es) * 2005-04-01 2011-05-05 Qualcomm Incorporated Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
CN100568863C (zh) * 2005-09-30 2009-12-09 中国科学院上海微系统与信息技术研究所 基于多子带滤波器组的发射、接收装置及其方法
EP1953737B1 (en) 2005-10-14 2012-10-03 Panasonic Corporation Transform coder and transform coding method
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
EP2115739A4 (en) * 2007-02-14 2010-01-20 Lg Electronics Inc METHODS AND APPARATUSES FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
CA2704812C (en) * 2007-11-06 2016-05-17 Nokia Corporation An encoder for encoding an audio signal
CN102568489B (zh) * 2007-11-06 2015-09-16 诺基亚公司 编码器
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
WO2009059631A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
AU2009267529B2 (en) * 2008-07-11 2011-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
EP3992966B1 (en) 2009-01-16 2022-11-23 Dolby International AB Cross product enhanced harmonic transposition
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US9514768B2 (en) 2010-08-06 2016-12-06 Samsung Electronics Co., Ltd. Audio reproducing method, audio reproducing apparatus therefor, and information storage medium
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP2011059714A (ja) * 2010-12-06 2011-03-24 Sony Corp 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5569476B2 (ja) * 2011-07-11 2014-08-13 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US9472199B2 (en) 2011-09-28 2016-10-18 Lg Electronics Inc. Voice signal encoding method, voice signal decoding method, and apparatus using same
CA2831176C (en) * 2012-01-20 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
KR101248125B1 (ko) 2012-10-15 2013-03-27 (주)알고코리아 주변소음 소거와 주파수 채널별 압축 기능을 가진 보청기
US9373337B2 (en) * 2012-11-20 2016-06-21 Dts, Inc. Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4691292A (en) * 1983-04-13 1987-09-01 Rca Corporation System for digital multiband filtering
DE3510573A1 (de) * 1985-03-23 1986-09-25 Philips Patentverwaltung Digitale analyse-synthese-filterbank mit maximaler taktreduktion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
FR2680924B1 (fr) * 1991-09-03 1997-06-06 France Telecom Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant.
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3437421B2 (ja) 1997-09-30 2003-08-18 シャープ株式会社 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP0957579A1 (en) 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Also Published As

Publication number Publication date
CA2464408C (en) 2012-02-21
DE60304479T2 (de) 2006-12-14
US20050080621A1 (en) 2005-04-14
DE60304479D1 (de) 2006-05-18
US7058571B2 (en) 2006-06-06
EP1527442B1 (en) 2006-04-05
JP3646938B1 (ja) 2005-05-11
CA2464408A1 (en) 2004-02-12
CN1286087C (zh) 2006-11-22
BR0305710A (pt) 2004-09-28
BRPI0305710B1 (pt) 2017-11-07
AU2003252727A8 (en) 2004-02-23
TWI303410B (en) 2008-11-21
KR20050042020A (ko) 2005-05-04
CN1585972A (zh) 2005-02-23
AU2003252727A1 (en) 2004-02-23
KR100723753B1 (ko) 2007-05-30
JP2005520217A (ja) 2005-07-07
WO2004013841A1 (en) 2004-02-12
ATE322735T1 (de) 2006-04-15
EP1527442A1 (en) 2005-05-04
TW200405267A (en) 2004-04-01
HK1073525A1 (en) 2005-10-07

Similar Documents

Publication Publication Date Title
ES2261974T3 (es) Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.
ES2683870T3 (es) Procesador de audio y método para procesar una señal de audio usando corrección de fase
JP7092809B2 (ja) 再構築帯域に対するエネルギ情報を用いてオーディオ信号を復号化または符号化する装置および方法
ES2259158T3 (es) Metodo y aparato decodificador audio.
ES2434947T3 (es) Procedimiento y dispositivo para la ocultación eficiente de un borrado de trama en códecs de voz
ES2247466T3 (es) Mejora de codificacion de la fuente utilizando replicacion de la banda espectral.
ES2237706T3 (es) Reconstruccion de componentes de alta frecuencia.
ES2273216T3 (es) Codificacion de audio.
ES2714153T3 (es) Decodificación de audio estéreo paramétrico
KR100602975B1 (ko) 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
ES2387943T3 (es) Ocultación de error de transmisión en una señal de audio digital en una estructura de decodificación jerárquica
RU2491658C2 (ru) Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
ES2972128T3 (es) Codificador de audio utilizando un procesador de dominio de frecuencia y un procesador de dominio de tiempo
ES2693051T3 (es) Aparato y procedimiento para generar una señal mejorada mediante el uso de relleno de ruido independiente
KR101411900B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 장치
ES2673319T3 (es) Control de coherencia de fase para señales armónicas en códecs de audio perceptual
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible
KR20070012194A (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JPWO2014199632A1 (ja) 音響信号の帯域幅拡張を行う装置及び方法
BRPI0910523A2 (pt) aparelho e método para gerar dados de saída de extensão de largura de banda
ES2337903T3 (es) Codificacion de audio.
ES2439693T3 (es) Codificación de señales de múltiples canales