ES2372014T3 - Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. - Google Patents

Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. Download PDF

Info

Publication number
ES2372014T3
ES2372014T3 ES09776808T ES09776808T ES2372014T3 ES 2372014 T3 ES2372014 T3 ES 2372014T3 ES 09776808 T ES09776808 T ES 09776808T ES 09776808 T ES09776808 T ES 09776808T ES 2372014 T3 ES2372014 T3 ES 2372014T3
Authority
ES
Spain
Prior art keywords
spectral
spectral slope
audio signal
bandwidth extension
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09776808T
Other languages
English (en)
Inventor
Max Neuendorf
Ulrich Kraemer
Frederik Nagel
Sascha Disch
Stefan Wabnik
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2372014T3 publication Critical patent/ES2372014T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada (210) con un segundo número de bits, el segundo número de bits es más pequeño que el primer número de bits, el cual comprende: una calculadora de parámetros de ampliación de ancho de banda controlable (10) para calcular parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro, para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y un detector de pendiente espectral (12) para detectar una pendiente espectral en una parte de tiempo de la señal de audio y para indicar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio.

Description

Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral
La presente invención se refiere a la codificación/decodificación de audio y, particularmente, a la codificación/decodificación de audio en el contexto de la ampliación de ancho de banda (BWE, según sus siglas en inglés). Una implementación muy conocida de BWE es la replicación espectral de ancho de banda (SBR, según sus siglas en inglés), la cual se ha estandarizado dentro de MPEG (Grupo de Expertos en Imágenes en Movimiento, según sus siglas en inglés).
El documento WO 00/45378 divulga una eficiente codificación de envolvente espectral utilizando tiempo variable/resolución de frecuencia y conmutación de tiempo/frecuencia. Una señal de entrada analógica se introduce en un convertidor A/D, formando una señal digital. La señal de audio digital se introduce en un codificador perceptual de audio, donde se lleva a cabo la codificación fuente. Adicionalmente, la señal digital se introduce en un detector de transitorios y en un banco de filtros de análisis, la cual divide la señal en su representación espectral (señales de sub– banda). El detector de transitorios utiliza las señales de sub–banda desde el banco de análisis o utiliza directamente las muestras de dominio en tiempo digital. El detector de transitorios divide la señal en gránulos y determina si los sub– gránulos dentro de los gránulos tienen que ser marcados como transitorios. Esta información se envía a un bloque de agrupamiento de envolvente, el cual especifica la cuadrícula de tiempo/frecuencia a utilizar para el gránulo actual. De acuerdo con la cuadrícula, el bloque combina señales de sub–banda uniformemente muestreadas a fin de obtener valores de envolvente no uniformemente muestreados. Dichos valores podrían ser el promedio o, alternativamente, la energía máxima para las muestras de sub–banda que han sido combinadas. Los valores de envolvente se introducen, junto con la información de agrupamiento, en el bloque codificador de envolvente. Este bloque decide en cuál dirección (tiempo o frecuencia) codificar los valores de envolvente. Las señales resultantes, la señal de salida del codificador de audio, la información de envolvente de ancho de banda, y las señales de control se introducen en un multiplexor, formando una corriente de bits en serie que se transmite o almacena.
Del lado del decodificador, un desmultiplexor restaura las señales e introduce la energía de salida del codificador perceptual de audio en un decodificador de audio, el cual produce una señal de audio digital de banda baja. La información de envolvente se introduce desde el desmultiplexor en el bloque decodificador de envolvente, el cual, mediante el uso de los datos de control, determina en cuál dirección se codifica la envolvente actual y decodifica los datos. La señal de banda baja desde el decodificador de audio se envía a un módulo de transposición, el cual genera un cálculo aproximado de la señal de banda alta original que consiste en uno o varios armónicos de la señal de banda baja. La señal de banda alta se introduce en un banco de filtros de análisis, el cual es del mismo tipo que el del lado codificador. Las señales de sub–banda se combinan en una unidad de agrupamiento de factor de escala. Mediante el uso de datos de control provenientes del desmultiplexor se adopta el mismo tipo de combinación y distribución de tiempo/frecuencia de las muestras de sub–banda correspondientes al lado codificador. La información de envolvente proveniente del desmultiplexor y la información proveniente de la unidad de agrupamiento de factor de escala se procesan en un módulo de control de ganancia. El módulo calcula los factores de ganancia a aplicar a las muestras de sub–banda antes de la reconstrucción utilizando un bloque de banco de filtros de síntesis. Por lo tanto, la energía de salida del banco de filtros de síntesis es una señal de audio de banda alta ajustada a la envolvente. La señal se agrega a la energía de salida de una unidad de retardo, la cual se introduce con la señal de audio de banda baja. El retardo compensa el tiempo de procesamiento de la señal de banda alta. Por último, la señal de ancho de banda digital obtenida se convierte en una señal de audio analógica en un convertidor digital a analógico.
Cuando los acordes sostenidos se combinan con transitorios bruscos que tienen principalmente contenidos de alta frecuencia, los acordes tienen alta energía en la banda baja y la energía transitoria es baja, por cuanto lo opuesto se aplica en la banda alta. Los datos de envolvente que se generan durante los intervalos de tiempo en los que hay transitorios están dominados por la energía transitoria alta intermitente. Los codificadores típicos funcionan en base a bloques, donde cada bloque representa un intervalo de tiempo fijo. Se emplea un detector de transitorios de anticipación en el lado codificador a fin de que se puedan procesar los datos de envolvente que se extienden a través de los límites de los bloques. Esto permite una selección más flexible de resoluciones de tiempo/frecuencia.
El estándar internacional ISO/IEC 14496–3 divulga una cuadrícula de tiempo/frecuencia en el Artículo 4.6.18.3.3, el cual describe el número de envolventes de SBR y los pisos de ruido así como también el segmento de tiempo asociado a cada envolvente de SBR y piso de ruido. Cada segmento de tiempo está definido por un límite de tiempo de inicio y un límite de tiempo de parada. La ranura de tiempo indicada por el límite de tiempo de inicio está incluida en el segmento de tiempo, la ranura de tiempo indicada por el límite de tiempo de parada está excluida del segmento de tiempo. El límite de tiempo de parada de un segmento equivale al límite de tiempo de inicio del segmento siguiente en la secuencia de segmentos. En consecuencia, los límites de tiempo de los envolventes de SBR dentro de un cuadro de SBR cuadro son decodificables en un lado decodificador. La cuadrícula de tiempo/cuadrícula de frecuencia correspondiente está determinada por el codificador.
La Patente de EEUU Nº 6.453.282 B1 divulga un método y dispositivo para detectar un transitorio en una señal de audio de tiempo discreto. Un codificador comprende un dispositivo de transformación de tiempo/frecuencia, un dispositivo de cuantificación/codificación y un dispositivo de formateo de corriente de bits. La etapa de cuantificación/codificación es controlada por una etapa de modelo psicoacústico. La etapa de transformación de tiempo/frecuencia es controlada por un detector de transitorios, en el cual la transformación de tiempo/frecuencia es controlada para conmutar desde una ventana larga a una ventana corta en caso de un transitorio detectado. En el detector de transitorios, la energía de una señal de audio filtrada en tiempo discreto en el segmento actual se compara con la energía de la señal de audio filtrada en tiempo discreto en un segmento anterior o bien, se forma una relación actual entre la energía de la señal de audio filtrada en tiempo discreto en el segmento actual y la energía de la señal de audio no filtrada en tiempo discreto en el segmento actual y dicha relación actual se compara con una relación anterior correspondiente. La existencia de una transitorio en la señal de audio en tiempo discreto se detecta utilizando una y/o la otra de dichas comparaciones.
La codificación de señales de frecuencia vocal es particularmente difícil debido al hecho de que la frecuencia vocal comprende no solo vocales, las cuales tienen un contenido predominantemente armónico, en el cual la mayor parte de la energía total se concentra en la parte inferior del espectro, pero también contiene una cantidad significativa de sibilantes. Un sibilante es un tipo de consonante fricativa o africada, que se forma dirigiendo una porción de aire a través de un canal angosto en el tracto vocal hacia el borde filoso de los dientes. El término sibilante a menudo se considera un sinónimo del término estridente. El término sibilante tiende a tener una definición articulatoria o aerodinámica que implica la producción de un ruido periódico ante un obstáculo. El término estridente se refiere a la calidad perceptual de intensidad determinada por las características de amplitud y frecuencia del sonido resultante (es decir, una definición auditiva o posiblemente acústica).
Los sibilantes son más altos que sus contrapartes no sibilantes, la mayor parte de su energía acústica ocurre a frecuencias superiores a los fricativos no sibilantes. La letra [s] tiene la máxima fuerza acústica a alrededor de 8.000 Hz,pero puede alcanzar un valor máximo de 10.000 Hz. La letra [f] tiene el volumen de su energía acústica a alrededor de
4.000 Hz, pero puede extenderse hasta alrededor de 8.000 Hz. Para los sibilantes existen símbolos IPA (Alfabeto Fonético Internacional, por sus siglas en inglés), donde se conocen los sibilantes alveolares y post–alveolares. También existen sibilantes silbados y, dependiendo del idioma correspondiente, otros sonidos relacionados.
Todas estas consonantes sibilantes en la palabra tienen en común que, si son inmediatamente precedidas por una vocal, dan lugar a un fuerte cambio de energía desde la parte de frecuencia baja a la parte de frecuencia alta. Un detector de transitorios, el cual está dirigido a la detección de un aumento de energía a través del tiempo podría no encontrarse en posición para detectar dicho cambio de energía. Sin embargo, esto puede no ser tan problemático en la codificación de audio de banda base en la cual, por ejemplo, no se aplica una ampliación de ancho de banda ya que los sibilantes tienen una duración que es normalmente más larga que los eventos transitorios que ocurren en un contexto de muy corto tiempo. En la codificación de banda base tal como, por ejemplo, la codificación AAC (codificación avanzada de audio, según sus siglas en inglés), se codifica todo el espectro con una resolución de alta frecuencia. Por lo tanto, no es forzosamente necesario detectar un desplazamiento de energía desde la parte de baja frecuencia a la parte de alta frecuencia debido a la naturaleza comparativamente estacionaria de los sibilantes en las señales de frecuencia vocal, cuando la longitud de un sibilante tal como, por ejemplo, una letra [s] en la palabra “sister” se compara con la longitud del cuadro de una función de ventana larga. Asimismo, de todos modos, la parte de alta frecuencia está codificada con una tasa de bits alta.
La situación, sin embargo, se vuelve problemática cuando los sibilantes aparecen en el contexto de ampliación de ancho de banda. En la ampliación de ancho de banda, la parte de baja frecuencia está codificada con una resolución alta/tasa de bits alta utilizando un codificador de banda base tal como, por ejemplo, un codificador AAC, y la banda alta está codificada con una pequeña resolución/tasa de bits pequeña generalmente utilizando sólo determinados parámetros tales como, por ejemplo, un envolvente espectral utilizando valores de envolvente espectral que tienen una resolución de frecuencia mucho más baja que la resolución de frecuencia del espectro de banda base. En otros términos, la distancia espectral entre dos parámetros de envolvente espectral será superior (por ejemplo, por lo menos diez veces) a la distancia espectral entre los valores espectrales en el espectro de banda baja.
Del lado decodificador se lleva a cabo una ampliación de ancho de banda, en la cual el espectro de banda baja se utiliza para regenerar el espectro de banda alta. Cuando en dicho contexto ocurre un desplazamiento de energía desde la parte de banda baja a la parte de banda alta, es decir, cuando aparece un sibilante, resulta evidente que dicho desplazamiento de energía ejercerá una influencia significativa sobre la precisión/calidad de la señal de audio reconstruida. Sin embargo, un detector de transitorios que busca un aumento (o disminución) en la energía no detectará dicho desplazamiento de energía de modo que los datos de la envolvente espectral para un cuadro de envolvente espectral, que cubre una parte del tiempo antes o después del sibilante, serán afectados por el desplazamiento de energía dentro del espectro. Del lado decodificador, el resultado será que debido a la falta de resolución temporal, todo el cuadro será reconstruido con una energía promedio, en la parte de frecuencia alta, es decir, no con la energía baja antes del sibilante y la energía alta después del sibilante. Esto producirá una disminución de la calidad de la señal estimada.
El objetivo de la presente invención consiste en proveer un concepto de ampliación de ancho de banda, el cual produzca una señal de audio de ancho de banda extendida mejorada.
Este objetivo se logra mediante un aparato para calcular la ampliación de los datos de ancho de banda de acuerdo con la reivindicación 1, un método para calcular la ampliación de los datos de ancho de banda de acuerdo con la reivindicación 18 o un programa informático de acuerdo con la reivindicación 19.
La presente invención está basada en el descubrimiento de que en el contexto de ampliación de ancho de banda es necesario detectar un desplazamiento de energía desde la parte de baja frecuencia a la parte de alta frecuencia. De acuerdo con la presente invención, para este propósito se aplica un detector de pendiente espectral (spectral tilt). Cuando se detecta dicho desplazamiento de energía, si bien, por ejemplo, la energía total en la señal no ha cambiado o incluso se ha reducido, se envía una señal instantánea de tiempo de inicio desde el detector de pendiente espectral a una calculadora de parámetros de ampliación de ancho de banda controlable de modo que la calculadora de parámetros de ampliación de ancho de banda fije un instante de tiempo de inicio para un cuadro de datos de parámetros de ampliación de ancho de banda. El tiempo final preciso del cuadro puede fijarse automáticamente tal como, por ejemplo, una determinada cantidad de tiempo posterior al tiempo de inicio preciso o de acuerdo con una determinada cuadrícula de cuadro o de acuerdo con una señal instantánea de tiempo de parada emitida por el detector de pendiente espectral, cuando el detector de pendiente espectral detecta el final del cambio de frecuencia o, en otros términos, la frecuencia cambia nuevamente desde alta frecuencia a baja frecuencia. Debido a los efectos psicoacústicos de post– enmascaramiento, los cuales son mucho más significativos que los efectos de pre–enmascaramiento, es más importante un control preciso del instante de tiempo de inicio de un cuadro que un instante de tiempo de parada del cuadro.
Preferentemente, y a fin de ahorrar recursos y evitar demoras en el procesamiento, lo cual es particularmente necesario para las aplicaciones de dispositivos móviles (por ejemplo, celulares), se implementa un detector de pendiente espectral como etapa de análisis LPC (Codificación de Predicción Lineal, según sus siglas en inglés) de bajo nivel. Preferentemente, la pendiente espectral de una parte de tiempo de la señal de audio se estima en base a uno o varios coeficientes LPC de orden bajo. La emisión de la señal instantánea de tiempo de inicio es controlada en base a una decisión umbral con un umbral predeterminado de la pendiente espectral, y preferentemente en base a un cambio en el signo de la señal de la pendiente espectral que representa una decisión umbral con un umbral de cero. Cuando se utiliza solamente el primer coeficiente LPC en la estimación de la pendiente espectral, sólo es suficiente determinar el signo de dicho primer coeficiente LPC, debido a que dicho signo determina el signo de la pendiente espectral y, por consiguiente, determina si una señal instantánea de tiempo de inicio tiene que emitirse o no a la calculadora de parámetros de ampliación de ancho de banda.
Preferentemente, el detector de pendiente espectral colabora con un detector de transitorios, el cual está adaptado para detectar un desplazamiento de energía, es decir, un aumento o disminución de energía de toda la señal de audio. En una forma de realización, la longitud de un cuadro de parámetros de ampliación de ancho de banda es mayor cuando se ha detectado un transitorio en la señal, en tanto que la calculadora de parámetros de ampliación de ancho de banda controlable fija una longitud menor de un cuadro cuando el detector de pendiente espectral ha indicado una señal instantánea de tiempo de inicio.
Las formas de realización preferidas de la presente invención se describen a continuación con respecto a los dibujos adjuntos, en los cuales:
La Fig. 1a es una forma de realización preferida de un aparato/método para calcular los datos de ampliación del ancho de banda de una señal de audio;
la Fig. 1b ilustra el encuadre resultante para una señal de audio que tiene transitorios y las correspondientes partes de tiempo del detector de pendiente espectral;
la Fig. 1c ilustra una tabla para controlar la resolución temporal/de cuadro de la calculadora de parámetros en respuesta a señales desde el detector de pendiente espectral y un detector de transitorios adicional;
la Fig. 2a
ilustra una pendiente espectral negativa de una señal no sibilante;
la Fig. 2b
ilustra una pendiente espectral positiva para una señal de tipo sibilante;
la Fig. 2c
explica el cálculo de la pendiente espectral m en base a parámetros LPC de orden bajo;
la Fig. 3
ilustra un diagrama en bloque de un codificador de acuerdo con una forma de realización preferida de
la presente invención; y
la Fig. 4 ilustra un decodificador de ampliación de ancho de banda.
Antes de analizar las Figs. 1 y 2 más detalladamente se describe un ejemplo de ampliación de ancho de banda con respecto a las Figs. 3 y 4.
La Fig. 3 ilustra una forma de realización para el codificador 300, la cual comprende módulos relacionados con SBR 310, un banco QMF (Filtros Espejo en Cuadratura, según sus siglas en inglés) de análisis 320, un filtro pasa bajos (filtro LP) 330, un codificador central AAC 340 y un formateador de carga útil de corriente de bits 350. Asimismo, el codificador 300 comprende la calculadora de datos de envolvente 210. El codificador 300 comprende una entrada de datos para muestras PCM (señal de audio 105; PCM = modulación por impulsos codificados), la cual está conectada al banco QMF de análisis 320, y a los módulos relacionados con SBR 310 y al filtro LP 330. El banco QMF de análisis 320 puede comprender un filtro pasa altos para separar la segunda banda de frecuencia 105b y está conectado a la calculadora de datos de envolvente 210, la cual, a su vez, está conectada al formateador de carga útil de corriente de bits 350. El filtro LP 330 puede comprender un filtro pasa bajos para separar la primera banda de frecuencia 105a y está conectado al codificador central AAC 340, el cual, a su vez, está conectado al formateador de carga útil de corriente de bits 350. Por último, el módulo relacionado con SBR 310 está conectado a la calculadora de datos de envolvente 210 y al codificador central AAC 340.
Por consiguiente, el codificador 300 reduce la frecuencia de muestreo de la señal de audio 105 para generar componentes en la banda de frecuencia central 105a (en el filtro LP 330), los cuales se introducen en el codificador central AAC 340, el cual codifica la señal de audio en la banda de frecuencia central y envía la señal codificada 355 al formateador de carga útil de corriente de bits 350 en el cual la señal de audio codificada 355 de la banda de frecuencia central se agrega a la corriente de audio codificada 345 (una corriente de bits). Por otra parte, la señal de audio 105 es analizada por el banco QMF de análisis 320 y el filtro pasa altos del banco QMF de análisis extrae los componentes de frecuencia de la banda de alta frecuencia 105b e introduce dicha señal en la calculadora de datos de envolvente 210 para generar datos de SBR 375. Por ejemplo, un BANCO QMF de 64 sub–bandas 320 lleva a cabo el filtrado de sub– bandas de la señal de entrada. La salida del banco de filtros (es decir, las muestras de sub–bandas) son valoradas por complejidad y, por lo tanto, son muestreadas en exceso por un factor de dos comparado a un banco QMF regular.
El módulo relacionado con SBR 310 por ejemplo, puede comprender un aparato para generar los datos de salida de BWE y controla la calculadora de datos de envolvente 210. Al utilizar los componentes de audio 105b generados por el banco QMF de análisis 320, la calculadora de datos de envolvente 210 calcula los datos de SBR 375 y envía los datos de SBR 375 al formateador de carga útil de corriente de bits 350, el cual combina los datos de SBR 375 con los componentes 355 codificados por el codificador central 340 en la corriente de audio codificada 345.
Alternativamente, el aparato para generar los datos de salida de BWE también puede formar parte de la calculadora de datos de envolvente 210 y el procesador también puede formar parte del formateador de carga útil de corriente de bits
350. Por lo tanto, los distintos componentes del aparato pueden formar parte de los distintos componentes del codificador de la Fig. 3.
La Fig. 4 ilustra una forma de realización para un decodificador 400, en el cual la corriente de audio codificada 345 es introducida en un formateador de carga útil de corriente de bits 357, el cual separa la señal de audio codificada 355 de los datos de SBR 375. La señal de audio codificada 355 es introducida por ejemplo, en un decodificador central AAC 360, el cual genera la señal de audio decodificada 105a en la primera banda de frecuencia. La señal de audio 105a (componentes en la primera banda de frecuencia) es introducida en un banco QMF de análisis de 32 bandas 370 generando por ejemplo, 32 sub-bandas de frecuencia 10532 desde la señal de audio 105a en la primera banda de frecuencia. La señal de audio de sub-bandas de frecuencia 10532 es introducida en el generador de “parches” (patch) 410 para generar una representación espectral de señales en bruto 425 (patch), la cual es introducida en una herramienta de SBR 430a. La herramienta de SBR 430a puede comprender, por ejemplo, una unidad de cálculo de piso de ruido para generar un piso de ruido. Asimismo, la herramienta de SBR 430a puede reconstruir armónicos faltantes o llevar a cabo un paso de filtrado inverso. La herramienta de SBR 430a puede implementar métodos conocidos de replicación de banda espectral a utilizar en la energía de salida de datos espectrales de QMF del generador de parches
410. El algoritmo de parches utilizado en el dominio de frecuencias podría emplear, por ejemplo, la simple representación de imágenes reflejadas o el copiado de los datos espectrales dentro del dominio de sub–bandas de frecuencia.
Por otra parte, los datos de SBR 375 (por ejemplo, que comprenden los datos de salida de BWE 102) son introducidos en un analizador sintáctico de corriente de bits 380, el cual analiza los datos de SBR 375 para obtener distinta sub– información 385 e introducirla, por ejemplo, en una unidad decodificadora y de descuantificación de Huffman 390 la cual, por ejemplo, extrae la información de control 412 y los parámetros de replicación de banda espectral 102, implicando una determinada resolución temporal de encuadre de datos de SBR. La información de control 412 controla el generador de parches 410. Los parámetros de replicación de banda espectral 102 son introducidos en la herramienta de SBR 430a así como también en un regulador de envolvente 430b. El regulador de envolvente 430b tiene la función de regular la envolvente para el parche generado. En consecuencia, el regulador de envolvente 430b genera la señal en bruto regulada 105b para la segunda banda de frecuencia y la introduce en un banco QMF de síntesis 440, el cual combina los componentes de la segunda banda de frecuencia 105b con la señal de audio en el dominio de frecuencias 10532. El banco QMF de síntesis 440 puede comprender, por ejemplo, 64 bandas de frecuencia y genera al combinar ambas señales (los componentes en la segunda banda de frecuencia 105b y la señal de audio de dominio de subbandas 10532) la señal de audio de síntesis 105 (por ejemplo, una salida de muestras PCM, PCM = modulación por impulsos codificados).
El banco QMF de síntesis 440 puede comprender un combinador, el cual combina la señal de dominio de frecuencias 10532 con la segunda banda de frecuencia 105b antes de que ésta se transforme en el dominio temporal y antes de que sea extraída como señal de audio 105. Opcionalmente, el combinador puede extraer la señal de audio 105 en el dominio de frecuencia.
Las herramientas de SBR 430a pueden comprender una herramienta convencional de piso de ruido, la cual agrega ruido adicional al espectro conectado (la representación espectral de señales en bruto 425), de modo tal que los componentes espectrales 105a que han sido transmitidos por un codificador central 340 y que son utilizados para sintetizar los componentes de la segunda banda de frecuencia 105b presenten propiedades de tonalidad similares a la segunda banda de frecuencia 105b, tal como se describe en la Fig. 3, de la señal original.
La Fig. 1a ilustra un aparato para calcular los datos de la ampliación de ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada con un segundo número de bits. El segundo número de bits es menor que el primer número de bits. Preferentemente, la primera banda de frecuencia es la banda de baja frecuencia y la segunda banda de frecuencia es la banda de alta frecuencia, aunque se conocen otras variantes de ampliación de ancho de banda, en las cuales la primera banda de frecuencia y la segunda banda de frecuencia son distintas entre sí, pero no son la banda baja y la banda alta. Además, de acuerdo con la enseñanza clave de las técnicas de ampliación de ancho de banda, la banda alta está codificada en forma mucho más gruesa que la banda baja. Preferentemente, la tasa de bits requerida para la banda alta es por lo menos 50% o incluso más preferentemente por lo menos 90% reducida con respecto a la tasa de bits para la banda baja. Por consiguiente, la tasa de bits para la segunda banda de frecuencia es de 50% o incluso menos que la tasa de bits para la banda baja.
El aparato ilustrado en la Fig. 1a comprende una calculadora de parámetros de ampliación de ancho de banda controlada 10 para calcular parámetros de ampliación de ancho de banda 11 para la segunda banda espectral de un modo de tipo cuadro para una secuencia de cuadros de la señal de audio. La calculadora de parámetros de ampliación de ancho de banda controlable 10 está configurada para aplicar un instante de tiempo de inicio controlable para un cuadro de la secuencia de cuadros.
El aparato de la invención además comprende un detector de pendiente espectral 12 para detectar una pendiente espectral en una parte de tiempo de la señal de audio, que se provee mediante la línea 13 a distintos módulos en la Fig. 1a. El detector de pendiente espectral está configurado para señalar un instante de tiempo de inicio para un cuadro de señal de audio, dependiendo de una pendiente espectral de la señal de audio, a la calculadora de parámetros de ampliación de ancho de banda controlable 10 de modo que la calculadora de parámetros de ampliación de ancho de banda 10 se encuentra en posición de aplicar un límite de tiempo de inicio en cuanto reciba un instante de tiempo de inicio señalado desde el detector de pendiente espectral 12.
Preferentemente, una señal de pendiente espectral/señal instantánea de tiempo de inicio es producida cuando un signo de una pendiente espectral de la parte de tiempo de la señal de audio es distinta de un signo de la pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio. Incluso más preferentemente, una señal instantánea de tiempo de inicio es emitida cuando la pendiente espectral cambia de negativa a positiva. En forma análoga, un instante de tiempo de parada puede ser señalado desde el detector de pendiente espectral 12 a la calculadora de parámetros de ampliación de ancho de banda 10 cuando ocurre un cambio de pendiente espectral desde una pendiente espectral positiva a una pendiente espectral negativa. Sin embargo, el instante de tiempo de parada puede inferirse sin tener en cuenta los cambios de pendiente espectral en la señal de audio. A modo de ejemplo, el instante de tiempo de parada del cuadro puede ser fijado por la calculadora de parámetros de ampliación de ancho de banda de manera autónoma cuando ha finalizado un determinado período de tiempo desde el instante de tiempo de inicio del cuadro correspondiente.
En la forma de realización preferida ilustrada en la Fig. 1a se provee un detector de transitorios adicional 14, el cual analiza la señal de audio 13 a fin de detectar cambios de energía en toda la señal desde una parte de tiempo a la próxima parte de tiempo. Cuando se detecta un determinado aumento mínimo de energía desde una parte de tiempo a la próxima parte de tiempo, el detector de transitorios 14 está configurado para producir una señal instantánea de tiempo de inicio a la calculadora de parámetros de ampliación de ancho de banda controlable 10 de modo que la calculadora de parámetros de ampliación de ancho de banda fija un instante de tiempo de inicio de un nuevo cuadro de parámetros de ampliación de ancho de banda de la secuencia de datos de cuadros de parámetros de ampliación de ancho de banda.
Preferentemente, el aparato para calcular la ampliación de los datos de ancho de banda además comprende un detector de música/lenguaje 15 para detectar si una parte de tiempo actual de la señal de audio es una señal de música o una señal de frecuencia vocal. En caso de que sea una señal de música, el detector de música/lenguaje 15 preferentemente deshabilitará el detector de pendiente espectral 12 a fin de ahorrar recursos de energía/informáticos y a fin de evitar aumentos de tasa de bits debido a pequeños cuadros innecesarios en señales que no son de frecuencia vocal. Este aspecto es particularmente útil para los dispositivos móviles, los cuales tienen recursos de procesamiento limitados y que tienen, aún más significativamente, recursos limitados de energía/batería. Entonces, sin embargo, el detector de música/lenguaje 15 detecta una parte de lenguaje en la señal de audio 13 y habilita al detector de pendiente espectral. Una combinación del detector de música/lenguaje 15 con el detector de pendiente espectral 12 es ventajosa porque las situaciones de pendiente espectral ocurren principalmente durante las partes de lenguaje, pero ocurren con menos probabilidad durante las partes de música. Incluso cuando dichas situaciones ocurren durante pasajes de música, la falta de dichos casos no es tan dramática debido al hecho de que la música tiene una característica de mejor enmascaramiento que el lenguaje. Los sibilantes son, tal como se ha descubierto, importantes para la inteligibilidad del lenguaje decodificado e importantes para la impresión de calidad subjetiva que el oyente tiene. En otros términos, la autenticidad del lenguaje está más relacionada con la reproducción clara de partes sibilantes del lenguaje. Esto, sin embargo, no es tan crítico para las señales de música.
La Fig. 1b ilustra una línea de tiempo superior que ilustra el encuadre fijado por la calculadora de parámetros de ampliación de ancho de banda 10 para una determinada parte en el tiempo de una señal de audio. El encuadre comprende diversos límites regulares que ocurren en el encuadre sin una detección de sibilantes, los cuales están indicados en 16a–16d. Adicionalmente, el encuadre comprende diversos límites de cuadro que se originan en la detección de sibilantes o en el cambio de pendiente espectral de la invención. Dichos límites están indicados en 17a– 17c. Además, la Fig. 1b aclara que el tiempo de inicio de cuadro de un determinado cuadro tal como un cuadro i coincide con un tiempo de parada de cuadro del cuadro i–1, es decir, un cuadro anterior.
En la forma de realización de la Fig. 1b, los instantes de tiempo de parada tales como, por ejemplo, los límites regulares 16a–16d de los cuadros se fijan automáticamente luego de la finalización de un determinado período de tiempo luego de un instante de tiempo de inicio de cuadro. La longitud de este período determina la resolución temporal para el encuadre de parámetros de ampliación de ancho de banda sin la detección de sibilantes.
Tal como se ilustra en la Fig. 1c, dicha resolución temporal puede fijarse en base a si una señal instantánea de tiempo de inicio se origina en el detector de transitorios 14 en la Fig. 1a o en el detector de pendiente espectral 12 en la Fig. 1a. Una norma general en la forma de realización ilustrada en la Fig. 1c es que, en cuanto la señal instantánea de tiempo de inicio es recibida desde el detector de pendiente espectral, se fija una resolución temporal superior (período de tiempo más corto entre el instante de tiempo de inicio y el instante de tiempo de parada del encuadre ilustrado en la Fig. 1b). Sin embargo, cuando el detector de pendiente espectral no detecta nada, pero el detector de transitorios 14 realmente detecta un transitorio, esto significa que sólo ha ocurrido un aumento de energía pero que no ha ocurrido un desplazamiento de energía. En dicha situación, el instante de tiempo de parada fijado automáticamente del cuadro 10b está bastante alejado del instante de tiempo de inicio debido al hecho de que un sibilante no está obviamente en la señal de audio y de que una señal de música no problemática u otra señal de audio está presente.
En el presente contexto cabe destacar que la fijación de límites dependientes de un detector de transitorios o de un detector de pendiente espectral aumenta la tasa de bits de la señal codificada. Se obtendría la tasa de bits más baja posible si los cuadros en la Fig. 1b tuvieran una gran longitud. Por otra parte, sin embargo, un gran encuadre reduce la resolución temporal de los datos de parámetros de ampliación de ancho de banda. Por lo tanto, la presente invención posibilita fijar un nuevo instante de tiempo de inicio (lo cual significa un instante de tiempo de parada del cuadro anterior), sólo cuando es realmente necesario. Asimismo, la variable resolución temporal que depende de la situación real, es decir, si se detectó un transitorio o un cambio de inclinación (por ejemplo, causado por un sibilante), permite adaptar un poco más el encuadre de un modo óptimo a los requerimientos de calidad/tasa de bits de modo que, siempre, se pueda alcanzar un óptimo compromiso entre ambos objetivos contradictorios.
La línea de tiempo inferior en la Fig. 1b ilustra un procesamiento de tiempo ejemplar llevado a cabo por el detector de pendiente espectral 12. En la forma de realización de la Fig. 1b, el detector de pendiente espectral funciona en base a bloques y, específicamente en un modo de superposición de modo que se investigan las partes de tiempo que se superponen a fin de determinar las situaciones de pendiente espectral. Sin embargo, el detector de pendiente espectral también puede funcionar en una corriente continua de muestras y no necesariamente tiene que aplicar el procesamiento en base a bloques ilustrado en la Fig. 1b.
Preferentemente, el instante de tiempo de inicio del cuadro es fijado poco antes del tiempo de detección de un cambio de pendiente espectral. Sin embargo, la calculadora de parámetros de ampliación de ancho de banda controlable tiene cierta libertad para fijar un nuevo límite de cuadro siempre que se asegure que, con respecto a un cuadro regular, el inicio del transitorio detectado por el detector de transitorios o el inicio del sibilante detectado por el detector de pendiente espectral está ubicado dentro del primer 25% del cuadro con respecto al tiempo o incluso más preferentemente está ubicado dentro del primer 10% en tiempo de la longitud del cuadro en un encuadre regular, en el cual está fijado, cuando no se obtiene una señal de energía de salida de pendiente espectral.
Preferentemente, además se asegura que por lo menos una parte del cambio detectado de pendiente espectral está en el nuevo cuadro y no está ubicado en el cuadro anterior, pero podrían ocurrir situaciones en las cuales una determinada “parte de comienzo” de un cambio de pendiente espectral esté ubicado en el cuadro anterior. Dicha parte de comienzo, sin embargo, debería ser preferentemente inferior a 10% del tiempo total del cambio de pendiente espectral.
En la forma de realización de la Fig. 1b se ha detectado una pendiente espectral en una zona horaria 18a, 18b y 18c, y la presencia del “instante de tiempo” del cambio de pendiente espectral está fijada en la zona horaria 18a. Por lo tanto, la calculadora de parámetros de ampliación de ancho de banda controlable 10 se asegurará que un cuadro esté fijado en cualquier instante de tiempo dentro de una zona horaria 18a, 18b, 18c. Este aspecto permite que la calculadora de parámetros de ampliación de ancho de banda mantenga un determinado encuadre básico en caso de que dicho encuadre básico sea necesario, siempre que la parte significativa del cambio de pendiente espectral esté ubicada luego del instante de tiempo de inicio, es decir, no en el cuadro anterior pero sí en el nuevo cuadro.
La Fig. 2a ilustra un espectro de energía de una señal que tiene una pendiente espectral negativa. Una pendiente espectral negativa significa una pendiente descendente del espectro. En sentido opuesto, la Fig. 2b ilustra un espectro de energía de una señal que tiene una pendiente espectral positiva. En otros términos, dicha pendiente espectral tiene una pendiente ascendente. Naturalmente, cada espectro tal como, por ejemplo, el espectro ilustrado en la Fig. 2a o el espectro ilustrado en la Fig. 2b tendrán variaciones en una escala local que tiene pendientes distintas de la pendiente espectral.
La pendiente espectral se puede obtener, cuando, por ejemplo, se coloca una línea recta en el espectro de energía tal como, por ejemplo, minimizando las diferencias al cuadrado entre dicha línea recta y el espectro real. La colocación de una línea recta en el espectro puede ser una de las formas para calcular la pendiente espectral de un espectro de corta duración. Sin embargo, se prefiere calcular la pendiente espectral utilizando coeficientes LPC.
La publicación “Efficient calculation of spectral tilt from various LPC parameters” de V. Goncharoff, E. Von Colln y R. Morris, Naval Command, Control and Ocean Surveillance Center (NCCOSC), RDT & E Division, San Diego, CA 92152– 52001, 23 de mayo, 1996 divulga diversas formas para calcular la pendiente espectral.
En una implementación, la pendiente espectral está definida como la pendiente de un ajuste lineal de cuadrados mínimos en el espectro de energía logarítmica. Sin embargo, también pueden aplicarse ajustes lineales en el espectro de energía no logarítmica o en el espectro de amplitud o en cualquier otro tipo de espectro. Esto es específicamente aplicable al contexto de la presente invención, donde en la forma de realización preferida, el interés principal es el signo de la pendiente espectral, es decir, si el resultado de la pendiente del ajuste lineal es positivo o negativo. Sin embargo, el valor real de la pendiente espectral, no tiene mayor importancia en la forma de realización preferida de la presente invención, en la cual se considera el signo, es decir, se aplica una decisión umbral con un umbral cero. En otras formas de realización, sin embargo, también puede ser útil un umbral distinto de cero.
Cuando se utiliza la codificación de predicción lineal (LPC) del lenguaje para modelar su espectro de corta duración, a nivel de cálculo informático es más eficiente calcular la pendiente espectral directamente de los parámetros de modelo LPC en lugar del espectro de energía logarítmica. La Fig. 2c ilustra una ecuación para los coeficientes cepstrales ck correspondientes al espectro de energía logarítmica de todos los polos de orden enésimo. En dicha ecuación, k es un índice de número entero, pn es el polo de enésimo orden en la representación de todos los polos de la función de transferencia H(z) del dominio z del filtro LPC. La ecuación siguiente en la Fig. 2c es la pendiente espectral en términos de coeficientes cepstrales. Específicamente, m es la pendiente espectral, k y n son números enteros y N es el polo de orden más alto del modelo de todos los polos para H(z). La ecuación siguiente en la Fig. 2c define el espectro de energía logarítmica S(w) del filtro LPC de enésimo orden. G es la constante de ganancia y ak son los coeficientes de predicción lineal, y w es igual a 2×n×f, donde f es la frecuencia. La ecuación más baja en la Fig. 2c directamente tiene como resultado los coeficientes cepstrales en función de los coeficientes LPC ak. Los coeficientes cepstrales ck luego se utilizan para calcular la pendiente espectral. En general, este método será más eficiente a nivel de cálculo informático que el factoreo del polinomio LPC para obtener los valores de polos, y la resolución para la pendiente espectral utilizando las ecuaciones de polos. Por consiguiente, luego de haber calculado los coeficientes LPC ak, se pueden calcular los coeficientes cepstrales ck utilizando la ecuación al final de la Fig. 2c y, luego, se pueden calcular los polos pn a partir de los coeficientes cepstrales utilizando la primera ecuación en la Fig. 2c. Posteriormente, en base a los polos se puede calcular la pendiente espectral m definida en la segunda ecuación de la Fig. 2c.
Se ha descubierto que el coeficiente LPC a1 de primer orden es suficiente para tener una buena estimación para el signo de la pendiente espectral. a1 es, por lo tanto, una buena estimación para c1. En consecuencia, c1 es una buena estimación para p1. Cuando p1 se inserta en la ecuación para la pendiente espectral m, resulta evidente que, debido al signo menos en la segunda ecuación en la Fig. 2c, el signo de la pendiente espectral m es inverso al signo del primer coeficiente LPC a1 en la definición del coeficiente LPC en la Fig. 2c.
La Fig. 3 ilustra el detector de pendiente espectral 12 en el contexto de un sistema codificador SBR. Específicamente, el detector de pendiente espectral 12 controla la calculadora de datos de envolvente y otros módulos relacionados con SBR a fin de aplicar un instante de tiempo de inicio de un cuadro de datos de parámetros relacionados con SBR. La Fig. 3 ilustra el banco QMF de análisis 320 para descomponer la segunda banda de frecuencia, la cual es preferentemente la banda alta, en un determinado número de sub–bandas tales como, por ejemplo, 32 sub–bandas a fin de realizar un cálculo de tipo sub–banda de los datos paramétricos de SBR. Preferentemente, el detector de pendiente espectral lleva a cabo un análisis LPC simple para recuperar sólo el coeficiente LPC de primer orden tal como se indica en el contexto de la Fig. 2c. Alternativamente, el detector de pendiente espectral 12 lleva a cabo un análisis espectral de la señal de entrada y calcula la pendiente espectral utilizando, por ejemplo, el ajuste lineal o cualquier otra forma para calcular la pendiente espectral. En general, se preferirá que la resolución del detector de pendiente espectral con respecto a una descomposición de frecuencias sea inferior a la resolución de frecuencias del banco QMF 320. En otras formas de realización, el detector de pendiente espectral 12 no llevará a cabo ningún tipo de descomposición de frecuencias tal como, por ejemplo, en el contexto de calcular sólo el coeficiente LPC a1 de primer orden indicado en el contexto de la Fig. 2c.
En otras formas de realización, el detector de pendiente espectral está configurado no sólo para calcular los coeficientes LPC de primer orden sino también para calcular diversos coeficientes LPC de orden bajo tales como, por ejemplo, los coeficientes LPC hasta el orden de 3 o 4. En dicha forma de realización, la pendiente espectral se calcula con una precisión tal que no solo se puede señalar un nuevo cuadro cuando la pendiente cambia de negativo a positivo, sino que también es preferible activar un nuevo cuadro cuando la pendiente espectral cambia de una alta magnitud con un signo negativo para una señal muy tonal a una baja magnitud (valor absoluto) con el mismo signo. Asimismo, con respecto al instante de tiempo de parada, es preferible calcular el fin de un cuadro cuando la pendiente espectral ha cambiado de un valor positivo alto a un valor positivo bajo, debido a que esto puede indicar que la característica de la señal cambia de sibilante a no sibilante. Independientemente de la forma de calcular la pendiente espectral, la detección de un instante de tiempo de inicio del cuadro no sólo puede ser señalado por un cambio de signo sino que, alternativamente o adicionalmente, puede ser señalado por un cambio de valor de inclinación en un determinado período de tiempo predeterminado, el cual es superior a un umbral de decisión.
En la forma de realización de signos, el umbral de decisión es un umbral absoluto a un valor de inclinación de cero, y en la forma de realización de cambios, el umbral es un umbral que indica un cambio de la inclinación, y este cálculo también se puede llevar a cabo aplicando un umbral absoluto en una función obtenida calculando el primer derivado de la función de inclinación a través del tiempo. En esta instancia, el detector de pendiente espectral está configurado para señalar el instante de tiempo de inicio del cuadro, cuando un valor diferencial entre un valor de pendiente espectral de la parte de tiempo de la señal de audio y un valor de pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio es superior a un valor de umbral predeterminado. El valor diferencial puede ser un valor absoluto (por ejemplo, para valores diferenciales negativos) o un valor con un signo (por ejemplo, para valores diferenciales positivos) y el valor de umbral predeterminado es, en esta forma de realización, distinta de cero.
Tal como se indica en el contexto de la Fig. 3 y 4, la calculadora de parámetros de ampliación de ancho de banda 10 está configurada para calcular los parámetros de envolvente espectral. En otras formas de realización, sin embargo, se prefiere que la calculadora de parámetros de ampliación de ancho de banda calcule adicionalmente los parámetros de piso de ruido, parámetros de filtrado inverso y/o parámetros armónicos faltantes conocidos de la parte de ampliación de ancho de banda de MPEG 4.
Básicamente se prefiere fijar un instante de tiempo de parada de un cuadro en respuesta a una señal de energía de salida del detector de pendiente espectral o en respuesta a un evento independiente de la señal de energía de salida del detector de pendiente espectral. El evento utilizado por la calculadora de parámetros de ampliación de ancho de banda para señalar un instante de tiempo de parada del cuadro es, por ejemplo, la existencia de un instante de tiempo que es un período fijo de tiempo posterior con respecto al instante de tiempo de inicio. Tal como se indica en el contexto de la Fig. 1c, dicho período fijo de tiempo puede ser bajo o alto. Cuando dicho período fijo de tiempo es alto, esto significa que hay una resolución temporal baja, y cuando dicho período fijo de tiempo es bajo, esto significa que hay una resolución temporal alta. Preferentemente, cuando el detector de transitorios 14 señala un transitorio se fija el primer período de tiempo pero se aplica una resolución temporal baja. En esta forma de realización, el período fijo de tiempo posterior con respecto al instante de tiempo de inicio es, por lo tanto, superior que en el otro caso, donde una señal instantánea de tiempo de inicio es producida por el detector de pendiente espectral. Cuando un instante de tiempo de inicio es producido por el detector de pendiente espectral, esto significa que hay una parte sibilante en una señal de frecuencia vocal, y, por lo tanto, es necesaria una resolución temporal alta. Por consiguiente, se fija un período fijo de tiempo más corto que en el caso donde un instante de tiempo de inicio para un cuadro fue señalado por el detector de transitorios 14 en la Fig. 1a.
En otras formas de realización, un detector de pendiente espectral puede estar basado en una información lingüística a fin de detectar sibilantes en el lenguaje. Cuando, por ejemplo, una señal de frecuencia vocal tiene meta–información asociada tal como, por ejemplo, el alfabeto fonético internacional, entonces un análisis de dicha meta–información también proveerá una detección de sibilantes de una parte del lenguaje. En este contexto se analiza la parte de meta– datos de la señal de audio.
Aunque algunos aspectos se han descripto en el contexto de un aparato, es obvio que dichos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a un paso del método o a una característica de un paso del método. En forma análoga, los aspectos descriptos en el contexto de un paso del método también representan una descripción de un bloque o ítem o característica correspondiente de un aparato correspondiente.
Dependiendo de determinados requerimientos para la implementación, las formas de realización de la invención se pueden implementar en un hardware o en un software. La implementación se puede llevar a cabo utilizando un medio digital de almacenamiento, por ejemplo un disco flexible, un DVD, un CD, una ROM (memoria de sólo lectura, según sus siglas en inglés), una PROM (memoria programable de sólo lectura, según sus siglas en inglés), una EPROM (una PROM borrable, según sus siglas en inglés), una EEPROM (una PROM borrable eléctricamente) o una memoria FLASH, que tiene señales de control legibles electrónicamente almacenadas en el mismo, las cuales colaboran (o son capaces de colaborar) con un sistema informático programable de modo que el método respectivo se lleve a cabo.
Algunas formas de realización de acuerdo con la invención comprenden un portador de datos que tiene señales de control legibles electrónicamente, las cuales son capaces de colaborar con un sistema informático programable, de modo que uno de los métodos descriptos en la presente se lleve a cabo.
En general, las formas de realización de la presente invención se pueden implementar como un producto de programa informático con un código de programa el cual es operativo para llevar a cabo uno de los métodos cuando el producto de programa informático se ejecuta en una computadora. El código de programa se puede almacenar, por ejemplo, en un portador legible por computadora.
Otras formas de realización comprenden el programa informático para llevar a cabo uno de los métodos descriptos en la presente, almacenados en un portador legible por computadora.
En otros términos, una forma de realización del método de la invención es, por lo tanto, un programa informático que tiene un código de programa para llevar a cabo uno de los métodos descriptos en la presente, cuando el programa informático se ejecuta en una computadora.
Una forma de realización adicional de los métodos de la invención es, por lo tanto, un portador de datos (o un medio digital de almacenamiento, o un medio legible por computadora) que comprende, grabado en el mismo, el programa informático para llevar a cabo uno de los métodos descriptos en la presente.
Una forma de realización adicional del método de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representa el programa informático para llevar a cabo uno de los métodos descriptos en la presente. La corriente de datos o la secuencia de señales pueden estar configuradas, por ejemplo, para ser transferida mediante una conexión de comunicación de datos, por ejemplo, a través de Internet.
Otra forma de realización comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los métodos descriptos en la presente.
Otra forma de realización comprende una computadora que tiene instalado el programa informático para llevar a cabo uno de los métodos descriptos en la presente.
En algunas formas de realización se puede utilizar un dispositivo lógico programable (por ejemplo un arreglo de puertas programables de campo) para llevar a cabo algunas o todas las funcionalidades de los métodos descriptos en la presente. En algunas formas de realización, un arreglo de puertas programables de campo puede colaborar con un microprocesador a fin de llevar a cabo uno de los métodos descriptos en la presente. En general, los métodos son llevados a cabo preferentemente por cualquier aparato de hardware.
Las formas de realización descriptas anteriormente son simplemente ilustrativas de los principios de la presente invención. Cabe entender que las modificaciones y variantes de los arreglos y detalles descriptos en la presente resultarán evidentes para los expertos en la técnica. Por consiguiente, la invención sólo está limitada por el alcance de las inminentes reivindicaciones de la patente y no por los detalles específicos presentados a modo de descripción y explicación de las formas de realización incluidas en la presente.
Una forma de realización de la invención es un aparato para calcular datos de ampliación de ancho de banda de una señal de audio en un sistema de amplificación de ancho de banda, en el cual una primera banda espectral está codificada con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada con un segundo número de bits, el segundo número de bits es más pequeño que el primer número de bits, el aparato comprende: una calculadora de parámetros de ampliación de ancho de banda controlable para calcular parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro, para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable y un detector de pendiente espectral para detectar una pendiente espectral en una parte de tiempo de la señal de audio y para indicar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio.
En otra forma de realización de la invención, la calculadora de parámetros de ampliación de ancho de banda controlable o el detector de pendiente espectral están configurados para procesar cuadros o partes de tiempo que se superponen.
En otra forma de realización de la invención, la calculadora de parámetros de ampliación de ancho de banda controlable está configurada para llevar a cabo un procesamiento selectivo de frecuencia de la señal de audio en la segunda banda espectral con una resolución de frecuencia, y en el cual el detector de pendiente espectral es operativo para procesar la parte de tiempo en el dominio temporal o en una forma selectiva de frecuencia con una resolución de frecuencia que es más pequeña que la resolución de frecuencia utilizada por la calculadora de parámetros de ampliación de ancho de banda controlable.
En otra forma de realización de la invención, el aparato además comprende un detector de música/lenguaje, siendo el detector de lenguaje/música operativo para activar el detector de pendiente espectral en una parte de lenguaje de la señal de audio y para desactivar el detector de pendiente espectral en una parte de música de la señal de audio.
En otra forma de realización , el aparato además comprende un detector de transitorios para controlar la calculadora de parámetros de ampliación de ancho de banda controlable para fijar el instante de tiempo de inicio, cuando se detecta un transitorio, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable está configurada para fijar un instante de tiempo de inicio, cuando el detector de pendiente espectral o el detector de transitorios ha producido una señal instantánea de tiempo de inicio, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable está configurada para aplicar la secuencia de cuadros con una resolución temporal superior en respuesta a una señal desde el detector de pendiente espectral en comparación con una resolución temporal aplicada, cuando la calculadora de parámetros de ampliación de ancho de banda controlable ha recibido una señal desde el detector de transitorios en una parte de tiempo de la señal de audio, para la cual el detector de pendiente espectral no ha señalado un instante de tiempo de inicio.

Claims (19)

  1. REIVINDICACIONES
    1. Aparato para calcular los datos de ampliación del ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada
    (210) con un segundo número de bits, el segundo número de bits es más pequeño que el primer número de bits, el cual comprende:
    una calculadora de parámetros de ampliación de ancho de banda controlable (10) para calcular parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro, para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y
    un detector de pendiente espectral (12) para detectar una pendiente espectral en una parte de tiempo de la señal de audio y para indicar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio.
  2. 2.
    Aparato de acuerdo con la reivindicación 1, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio del cuadro, cuando un signo de una pendiente espectral de la parte de tiempo de la señal de audio es distinta de un signo de la pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio.
  3. 3.
    Aparato de acuerdo con las reivindicaciones 1 o 2, en el cual el detector de pendiente espectral (12) es operativo para llevar a cabo un análisis LPC de la parte de tiempo para estimar uno o más coeficientes LPC de orden bajo y para analizar dicho uno o más coeficientes LPC de orden bajo a fin de determinar, si la parte de la señal de audio tiene una pendiente espectral positiva o negativa.
  4. 4.
    Aparato de acuerdo con la reivindicación 3, en el cual el detector de pendiente espectral (12) es operativo sólo para calcular el primer coeficiente LPC y no para calcular coeficientes LPC adicionales y para analizar un signo del primer coeficiente LPC y para señalar un instante de tiempo de inicio del cuadro dependiendo del signo del primer coeficiente LPC.
  5. 5.
    Aparato de acuerdo con la reivindicación 4, en el cual el detector de pendiente espectral (12) está configurado a fin de determinar la pendiente espectral como una pendiente espectral negativa, en el cual una energía espectral disminuye de frecuencias inferiores a frecuencias superiores, cuando el primer coeficiente LPC tiene un signo positivo, y para detectar la pendiente espectral como una pendiente espectral positiva, en el cual la energía espectral aumenta de frecuencias inferiores a frecuencias superiores, cuando el primer coeficiente LPC tiene un signo negativo.
  6. 6.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para calcular uno o más de los siguientes parámetros para el cuadro:
    parámetros de envolvente espectral, parámetros de ruido, parámetros de filtrado inverso, o parámetros armónicos faltantes.
  7. 7.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para fijar el instante de tiempo de inicio de un cuadro dependiendo de un instante de tiempo de inicio de la parte de tiempo de la señal de audio, sobre el cual se basa la detección de pendiente espectral.
  8. 8.
    Aparato de acuerdo con la reivindicación 7, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para fijar el instante de tiempo de inicio del cuadro idéntico al instante de tiempo de inicio de la parte de tiempo, en el cual el cambio de pendiente espectral ha sido detectado.
  9. 9.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) o el detector de pendiente espectral (12) están configurados para procesar cuadros o partes de tiempo que se superponen.
  10. 10.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) es operativa para fijar un instante de tiempo de parada de un cuadro en respuesta al detector de pendiente espectral (12) o en respuesta a un evento independiente en una pendiente espectral de la señal de audio.
  11. 11.
    Aparato de acuerdo con la reivindicación 10, en el cual el evento utilizado por la calculadora de parámetros de ampliación de ancho de banda controlable (10) es la existencia de un instante de tiempo que es un período fijo de tiempo posterior al instante de tiempo de inicio.
  12. 12.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para llevar a cabo un procesamiento selectivo de frecuencia de la señal de audio (320) en la segunda banda espectral con una resolución de frecuencia, y en el cual el detector de pendiente espectral (12) es operativo para procesar la parte de tiempo en el dominio temporal o en una forma selectiva de frecuencia con una resolución de frecuencia que es más pequeña que la resolución de frecuencia utilizada por la calculadora de parámetros de ampliación de ancho de banda controlable (10).
  13. 13.
    Aparato de acuerdo con una de las reivindicaciones anteriores, el cual además comprende:
    un detector de transitorios (14) para controlar la calculadora de parámetros de ampliación de ancho de banda controlable (10) para fijar el instante de tiempo de inicio, cuando se detecta un transitorio,
    en el cual la calculadora de parámetros de ampliación de ancho de banda controlable está configurada para fijar un instante de tiempo de inicio, cuando el detector de pendiente espectral (12) o el detector de transitorios
    (14) ha producido una señal instantánea de tiempo de inicio.
  14. 14.
    Aparato de acuerdo con una de las reivindicaciones anteriores, el cual además comprende un detector de música/lenguaje (15), siendo el detector de lenguaje/música operativo para activar el detector de pendiente espectral (12) en una parte de lenguaje de la señal de audio y para desactivar el detector de pendiente espectral (12) en una parte de música de la señal de audio.
  15. 15.
    Aparato de acuerdo con una de las reivindicaciones anteriores, en el cual el detector de pendiente espectral (12) está configurado a fin de determinar, si la parte de tiempo comprende un sibilante de una parte de lenguaje o un no sibilante de una parte de lenguaje, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio para el cuadro, cuando se detecta un cambio de un no sibilante a un sibilante.
  16. 16.
    Aparato de acuerdo con la reivindicación 13,
    en el cual la calculadora de parámetros de ampliación de ancho de banda controlable (10) está configurada para aplicar la secuencia de cuadros con una resolución temporal superior en respuesta a una señal desde el detector de pendiente espectral (12) en comparación con una resolución temporal aplicada, cuando la calculadora de parámetros de ampliación de ancho de banda controlable (10) ha recibido una señal desde el detector de transitorios (14) en una parte de tiempo de la señal de audio, para la cual el detector de pendiente espectral (12) no ha señalado un instante de tiempo de inicio.
  17. 17.
    Aparato de acuerdo con la reivindicación 1, en el cual el detector de pendiente espectral (12) está configurado para señalar el instante de tiempo de inicio del cuadro, cuando una diferencia entre un valor de pendiente espectral de la parte de tiempo de la señal de audio y un valor de pendiente espectral de la señal de audio en la parte de tiempo anterior de la señal de audio es mayor que un valor de umbral predeterminado.
  18. 18.
    Método para calcular la ampliación de los datos de ancho de banda de una señal de audio en un sistema de ampliación de ancho de banda, en el cual una primera banda espectral está codificada (340) con un primer número de bits y una segunda banda espectral distinta de la primera banda espectral está codificada
    (210) con un segundo número de bits que es más pequeño que el primer número de bits, el cual comprende:
    calcular (10) los parámetros de ampliación de ancho de banda para la segunda banda de frecuencia de un modo de tipo cuadro para una secuencia de cuadros de la señal de audio, en la cual un cuadro tiene un instante de tiempo de inicio controlable; y
    detectar (12) una pendiente espectral en una parte de tiempo de la señal de audio y señalar el instante de tiempo de inicio para el cuadro dependiendo de la pendiente espectral de la señal de audio.
  19. 19. Programa informático que tiene un código de programa para llevar a cabo, cuando se ejecuta en una computadora, el método para calcular la ampliación de los datos de ancho de banda de acuerdo con la reivindicación 18.
ES09776808T 2008-07-11 2009-06-23 Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. Active ES2372014T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7987108P 2008-07-11 2008-07-11
US79871 2008-07-11

Publications (1)

Publication Number Publication Date
ES2372014T3 true ES2372014T3 (es) 2012-01-13

Family

ID=40929509

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09776808T Active ES2372014T3 (es) 2008-07-11 2009-06-23 Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.

Country Status (19)

Country Link
US (1) US8788276B2 (es)
EP (1) EP2176862B1 (es)
JP (1) JP5010743B2 (es)
KR (1) KR101182258B1 (es)
CN (1) CN101836253B (es)
AR (1) AR072703A1 (es)
AT (1) ATE522901T1 (es)
AU (1) AU2009267529B2 (es)
BR (1) BRPI0904958B1 (es)
CA (1) CA2699316C (es)
ES (1) ES2372014T3 (es)
HK (1) HK1142432A1 (es)
IL (1) IL203928A (es)
MY (1) MY150373A (es)
PL (1) PL2176862T3 (es)
RU (1) RU2443028C2 (es)
TW (1) TWI457914B (es)
WO (1) WO2010003543A1 (es)
ZA (1) ZA201000941B (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US9247547B2 (en) * 2009-10-15 2016-01-26 Qualcomm Incorporated Downlink and uplink resource element mapping for carrier extension
US9026236B2 (en) 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
ES2588745T3 (es) * 2010-07-05 2016-11-04 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, dispositivo codificador, dispositivo decodificador, programa y medio de grabación
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
CN102419977B (zh) * 2011-01-14 2013-10-02 展讯通信(上海)有限公司 瞬态音频信号的判别方法
CN102629470B (zh) * 2011-02-02 2015-05-20 Jvc建伍株式会社 辅音区间检测装置及辅音区间检测方法
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN109036443B (zh) 2013-01-21 2023-08-18 杜比实验室特许公司 用于在不同回放设备之间优化响度和动态范围的系统和方法
BR112015017632B1 (pt) 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
CA2961336C (en) * 2013-01-29 2021-09-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates
MX347080B (es) 2013-01-29 2017-04-11 Fraunhofer Ges Forschung Llenado con ruido sin informacion secundaria para celp (para codificadores tipo celp).
KR101737254B1 (ko) 2013-01-29 2017-05-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법
CN105378835B (zh) 2013-02-20 2019-10-01 弗劳恩霍夫应用研究促进协会 使用依赖瞬态位置的重叠对音频信号编码或译码的设备及方法
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
ES2688134T3 (es) * 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
DK3058567T3 (en) * 2013-10-18 2017-08-21 ERICSSON TELEFON AB L M (publ) CODING POSITIONS OF SPECTRAL PEAKS
US9640185B2 (en) * 2013-12-12 2017-05-02 Motorola Solutions, Inc. Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
JP6705142B2 (ja) * 2015-09-17 2020-06-03 ヤマハ株式会社 音質判定装置及びプログラム
KR102250472B1 (ko) * 2016-03-07 2021-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
TWI652597B (zh) * 2017-12-05 2019-03-01 緯創資通股份有限公司 電子裝置及其解鎖方法
EP4095855B1 (en) * 2018-01-17 2023-10-04 Nippon Telegraph And Telephone Corporation Decoding apparatus, encoding apparatus, and methods and programs therefor
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
BR112021012753A2 (pt) * 2019-01-13 2021-09-08 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
CN112151046B (zh) * 2020-09-25 2024-06-18 北京百瑞互联技术股份有限公司 Lc3编码器自适应调节多声道传输码率的方法、装置及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
EP1527442B1 (en) 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
US7949057B2 (en) 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
JP2006023658A (ja) * 2004-07-09 2006-01-26 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びオーディオ信号符号化方法
KR100956877B1 (ko) 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
TWI271703B (en) 2005-07-22 2007-01-21 Pixart Imaging Inc Audio encoder and method thereof
JP2007333785A (ja) * 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing

Also Published As

Publication number Publication date
HK1142432A1 (en) 2010-12-03
AU2009267529B2 (en) 2011-03-03
EP2176862B1 (en) 2011-08-31
BRPI0904958A2 (pt) 2015-06-30
TW201007709A (en) 2010-02-16
IL203928A (en) 2013-06-27
US20110099018A1 (en) 2011-04-28
JP2011501225A (ja) 2011-01-06
AU2009267529A1 (en) 2010-01-14
CN101836253A (zh) 2010-09-15
CN101836253B (zh) 2012-06-13
MY150373A (en) 2013-12-31
TWI457914B (zh) 2014-10-21
WO2010003543A1 (en) 2010-01-14
ATE522901T1 (de) 2011-09-15
CA2699316C (en) 2014-03-18
CA2699316A1 (en) 2010-01-14
KR101182258B1 (ko) 2012-09-14
PL2176862T3 (pl) 2012-03-30
AR072703A1 (es) 2010-09-15
BRPI0904958B1 (pt) 2020-03-03
ZA201000941B (en) 2011-04-28
RU2443028C2 (ru) 2012-02-20
JP5010743B2 (ja) 2012-08-29
US8788276B2 (en) 2014-07-22
EP2176862A1 (en) 2010-04-21
KR20100083135A (ko) 2010-07-21
RU2010109206A (ru) 2011-09-20

Similar Documents

Publication Publication Date Title
ES2372014T3 (es) Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
ES2539304T3 (es) Un aparato y un método para generar datos de salida por ampliación de ancho de banda
ES2380307T3 (es) Esquema de codificación/decodificación de audio de tasa de transmisión de bits baja con preprocesamiento común.
KR101803849B1 (ko) 고주파 복원 동안 오디오 신호들의 프로세싱
ES2439549T3 (es) Un aparato y un método para decodificar una señal de audio codificada
ES2592416T3 (es) Esquema de codificación/decodificación de audio que tiene una derivación conmutable
KR101411900B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 장치
KR20090043983A (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR20160024920A (ko) 에너지 조정 모듈을 갖는 대역폭 확장 모듈을 구비한 오디오 디코더
EP1872364A1 (en) Source coding and/or decoding
AU2013257391B2 (en) An apparatus and a method for generating bandwidth extension output data