ES2461141T3 - Aparato y procedimiento para generar una señal de ancho de banda ampliado - Google Patents

Aparato y procedimiento para generar una señal de ancho de banda ampliado Download PDF

Info

Publication number
ES2461141T3
ES2461141T3 ES09776840.2T ES09776840T ES2461141T3 ES 2461141 T3 ES2461141 T3 ES 2461141T3 ES 09776840 T ES09776840 T ES 09776840T ES 2461141 T3 ES2461141 T3 ES 2461141T3
Authority
ES
Spain
Prior art keywords
patch
input signal
band
signal
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09776840.2T
Other languages
English (en)
Inventor
Frederik Nagel
Sascha Disch
Max Neuendorf
Stefan Bayer
Marc Gayer
Markus Lohwasser
Nikolaus Rettelbach
Ulrich Krämer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2461141T3 publication Critical patent/ES2461141T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

Un aparato (100; 300; 400; 700; 800; 900) para generar una señal de ancho de banda ampliado (122) desde una señal de entrada (102), donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el aparato: un generador de parches (110) configurado para generar un primer parche (112) desde la primera banda de la señal de entrada (102) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche (114) desde la primera banda de la señal de entrada (102) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche (114) generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche (112) generado de acuerdo con el primer algoritmo de implementación de parches; y un combinador (120) configurado para combinar el primer parche (112), el segundo parche (114) y la primera banda de la señal de entrada (102) para obtener la señal ampliada del ancho de banda (122), donde el aparato para generar una señal de ancho de banda ampliado está configurado para ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el primer parche (112) y el segundo parche (114) o para escalar el primer parche (112) y el segundo parche (114), o para escalar solamente uno de los parches primero o segundo para obtener un parche escalado, para combinar entonces, por el combinador (120) el parche escalado y el parche no escalado de los parches primero y segundo para obtener parches combinados, y para entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada, para que la señal de ancho de banda ampliado (122) cumpla con un criterio de envolvente espectral.

Description

Aparato y procedimiento para generar una señal de ancho de banda ampliado
[0001] Las formas de realización de acuerdo con la invención se relacionan con el procesamiento de señales de audio y, en particular con un aparato y un procedimiento para generar una señal de ancho de banda ampliado desde una señal de entrada, un aparato y un procedimiento para proveer una señal reducida de ancho de banda basada en una señal de entrada y una señal de audio.
[0002] La codificación de señales codificadas perceptivamente adaptadas, que proveen una reducción substancial de tasa de datos para un eficiente almacenamiento y transmisión de estas señales, ha ganado una gran aceptación en muchos campos. Se conocen muchos algoritmos de codificación, por ejemplo, MPEG ½ Capa 3 (“MP3”) o MPEG 4 AAC (Codificación de Audio Avanzada). Sin embargo, la codificación utilizada para esto, en particular cuando operan en tasas de bits muy bajas, puede conducir a una reducción subjetiva de la calidad de audio causada a menudo por una limitación inducida del lado del codificador del ancho de banda de la señal de audio a transmitir.
[0003] WO 98 57436 somete la señal de audio a una limitación de banda en dicha situación del lado del codificador y codifica sólo una banda inferior de la señal de audio por medio de un codificador de audio de alta calidad
(“codificador de núcleo”). La banda superior, sin embargo, es caracterizada en forma basta, es decir, por medio de
un grupo de parámetros que reproduce la envolvente espectral de la banda superior. Del lado del decodificador, la banda superior es luego sintetizada. Para este fin, se propone una transposición de armónicos donde la banda inferior de la señal de audio decodificada es suministrada a un banco de filtro. Los canales del banco de filtro de la
banda inferior se conectan a los canales del banco de filtro de la banda superior, o son “sujetos a parches”, y cada
señal de paso de banda sujeta a un parche es sometida a un ajuste de envolvente. El banco de filtro de síntesis que pertenece a un banco de filtro de análisis especial recibe señales de paso de banda de la banda inferior que están sujetas a parches en forma armónica en la banda superior. La señal de salida del banco de filtro de síntesis es una señal de audio que se extiende con respecto a su ancho de banda original transmitida desde el lado del codificador hacia el lado del decodificador por el codificador de núcleo que opera a una tasa de datos muy baja. En particular, los cálculos del banco de filtro y la implementación de parches (patching) en el dominio del banco de filtro pueden requerir de un gran esfuerzo informático.
[0004] Los procedimientos que minimizan la complejidad de la ampliación del ancho de banda de las señales de audio con banda limitada utilizan en cambio una función de copia de las porciones de señal de baja frecuencia (BF) en el rango de frecuencia alta (FA) con el fin de aproximar la información ausente debido a la limitación de banda. Dichos procedimientos se describen en M. Dietz, L. Liljeryd, K. Kjörling y O. Kunz, “Replicación de Banda Espectral”, un nuevo enfoque en la codificación de audio”, en la 112º Convención AES de Munich, Mayo de 2002; S. Meltzer, R. Böhm y F. Henn, “Codificadores de audio SBR ampliados para la difusión digital como “Mundial de Radio Digital”
(DRM, por su sigla en inglés), 112º Convención AES de Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M.
Lutzky, “Ampliación de mp3 con SBR: Rasgos y Capacidades del nuevo algoritmo mp3PRO”, en 112º Convención AES de Munich, Mayo de 2002; Norma Internacional ISO/IEC 1449-3:2001/FPDAM 1, “Ampliación de Ancho de Banda”, ISO/IEC 2002, o “Procedimiento y aparato de ampliación de ancho de banda de voz”, Vau Iyengar et al.
Patente de EEUU Nº 5.455.888.
[0005] En estos procedimientos, no se realiza una transposición de armónicos, pero se introducen señales de paso de banda sucesivas desde la banda inferior en sucesivos canales del banco de filtro de la banda superior. Por medio de este procedimiento, se logra una aproximación basta de la banda superior de la señal de audio. En otro paso, esta aproximación basta de la señal es luego asimilada con respecto a la original mediante un post procesamiento utilizando información de control obtenida de la señal original. En este caso, por ejemplo, los factores de ajuste a escala sirven para adaptar la envolvente espectral, un filtrado inverso, y el agregado de un piso de ruido para adaptar la tonalidad y una suplementación de las pociones de señal sinusoidal para armónicos ausentes, como se describe también en la norma de Codificación de Audio Avanzada de Alta Eficiencia MPEG-4 (HE-AAC, por su sigla en inglés).
[0006] Por otro lado, otros procedimientos utilizan un codificador de fase operado por voz para la ampliación de ancho de banda. Al aplicar el codificador de fase operado por voz para la expansión espectral, las líneas de frecuencia se alejan entre sí. Si existe un espacio en el espectro, por ejemplo, por cuantización, el mismo se incrementa por la expansión. En una adaptación, de energía, las líneas que permanecen en el espectro reciben demasiada energía en comparación con las líneas respectivas en la señal original.
[0007] La Fig. 13 muestra una ilustración esquemática de una ampliación de banda 1300 que utiliza un codificador de fase operado por voz. En este ejemplo, se agregan dos parches (patches) 1312, 1314 a una banda de baja frecuencia 1302 de una señal. La frecuencia de corte superior 1320 de la señal, también llamada frecuencia X (frecuencia de cruce) es la frecuencia del extremo inferior del parche vecino 1312 y el doble de la frecuencia de cruce es la frecuencia de corte superior del parche vecino 1312 y la frecuencia de corte inferior del próximo parche 1314. El codificador de fase operado por voz duplica la frecuencia de las líneas de frecuencia de la banda de frecuencia baja 1302 de la señal para obtener el parche vecino 1312 y triplica las frecuencias de las líneas de frecuencia de la banda de frecuencia baja 1302 de la señal para obtener el próximo parche 1314. Por lo tanto, la densidad espectral del parche vecino 1312 es sólo la mitad de la densidad espectral de la banda de frecuencia baja 1302 de la señal y la densidad espectral del próximo parche 1314 es sólo un tercio de la densidad espectral de la banda de frecuencia baja 1302 de la señal.
[0008] Mediante la concentración de la energía en bandas (parches) en sólo pocas líneas de frecuencia, se produce un cambio substancial en el timbre el cual difiere del original. La energía de más bandas anteriores (líneas de frecuencia) se suma a las pocas que restan.
[0009] Algunos ejemplos, para los codificadores de fase operados por voz y sus aplicaciones se presentan en
“Frederik Nagel y Sascha Disch, Un procedimiento de armónicos para la ampliación de ancho de banda para codificadores de audio”, ICASSP´09 y “M. Puckette. Codificador de fase-bloqueada operado por voz. IEEE ASSP Conferencia sobre Aplicaciones del Procesamiento de Señal a Audio y Acústica, Mohonk 1995”. Röbel, A: Detección y preservación transitoria en el codificador de fase operado por voz; citesee,ist.psu.edu/679246,HTML”, “Laroche L., Dolson M,: Modificación de audio mejorada en ajuste a escala de tiempo del codificador de fase operado por voz “, IEEE Procesamiento de Audio y Voz Trans., Vol 7, Nº 3, pp. 323-332” y Patente de EEUU 6549884.
[0010] Un procedimiento para llenar los espacios se muestra en WO 00/45379. La misma contiene un procedimiento y un aparato para la ampliación de sistemas de codificación de fuente que utilizan la reconstrucción de frecuencia alta. La aplicación trata el problema de contenidos de ruido insuficiente en una banda alta reconstruida mediante el agregado de piso de ruido adaptativo. El agregado de ruido podrá llenar los espacios pero la calidad o calidad subjetiva de audio no podrá aumentar lo suficiente.
[0011] El artículo de la convención AES "A closer look into MPEG-4 High Efficiency AAC", 10 de octubre de 2003, M. Wolters, et al., analiza la tecnología de replicación de banda espectral MPEG (SBR) como una tecnología de compresión disponible como parte del estándar MPEG . Se combina con la codificación de audio avanzada MPEG Advanced Audio Coding (AAC) y mejora la eficiencia de la codificación. Todo el procesamiento SBR en la decodificación SBR se realiza en el dominio QMF. Un módulo generador HF recrea la banda alta parcheando subbandas QMF desde la banda baja existente a la banda alta. Además, se realiza filtrado inverso sobre una base de sub-banda QMF, basado en los datos de control obtenidos a partir de la corriente de bits. La envolvente espectral de la banda alta regenerada es modificada por el ajustador de envolvente y se añaden componentes adicionales, tales como el ruido y la sinusoide de acuerdo con los datos de control en el flujo de bits.
[0012] La presente invención tiene como objetivo proveer un concepto para una ampliación de ancho de banda de señales de audio que incrementa la calidad subjetiva de señales ampliadas de ancho de banda.
[0013] Este objetivo se soluciona mediante un aparato de acuerdo con las reivindicaciones 1 u 11, o un procedimiento de acuerdo con la reivindicación 14 o 15.
[0014] Una forma de realización de la invención provee un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada. La señal de entrada está representada, para una primera banda por datos de primera resolución y para una segunda banda por datos de segunda resolución, la segunda resolución es menor a la primera resolución. El aparato comprende un generador de parche y un combinador. El generador de parche está configurado para generar un primer parche desde la primera banda de la señal de entrada de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche desde la primera banda de la señal de entrada de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches. El combinador está configurado para combinar el primer parche, el segundo parche y la primera banda de la señal de entrada para obtener la señal de ancho de banda ampliado. El aparato para generar una señal de ancho de banda ampliado está configurado para ajustar a escala la señal de entrada de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el primer parche y el segundo parche, para que la señal de ancho de banda ampliado cumpla con el criterio de envolvente espectral.
[0015] Las formas de realización de acuerdo con la presente invención se basan en la idea central que un parche con baja densidad espectral (lo que significa, por ejemplo, que el parche comprende espacios en comparación con una banda de baja frecuencia de la señal de entrada) es combinado con un parche con alta densidad espectral (lo que significa, por ejemplo, que el parche comprende sólo pocos espacios o no comprende espacios en comparación con una banda de baja frecuencia de la señal de entrada) para ampliar el ancho de banda de una señal de audio. Como ambos parches son generados basándose en la señal de entrada, la ampliación de ancho de banda de frecuencia alta de la banda de baja frecuencia de la señal de entrada puede proveer una buena aproximación de la señal de audio original. Además, el primer y segundo parche pueden ser ajustado a escalas antes (ajustando a escala la señal de entrada) o después de la generación para cumplir un criterio de envolvente espectral, ya que la envolvente espectral de la señal de audio original debería ser considerada para la reconstrucción de la banda de
frecuencia alta de la señal de entrada. De esta manera, la calidad subjetiva o la calidad de audio de la señal ampliada del ancho de banda puede incrementarse en forma significativa.
[0016] En algunas formas de realización de acuerdo con la presente invención, el primer algoritmo de implementación de parches es un algoritmo de implementación de parches armónicos. En otras palabras, el primer parche es generado para que sólo las frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada estén contenidas por el primer parche. Además, el segundo algoritmo de implementación de parches puede ser generado para que el segundo parche contenga frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada y frecuencias que no son múltiplos enteros de frecuencias de la primera banda de la señal de entrada. Por ende, la densidad espectral del segundo parche es mayor que la densidad espectral del primer parche. Al combinar el primer parche y el segundo parche, las líneas de frecuencia ausentes del primer parche pueden llenarse por las líneas de frecuencia del segundo parche. De esta manera, los espacios de la ampliación de ancho de banda de armónicos de acuerdo con el primer algoritmo de implementación de parches pueden llenarse por el segundo parche y la calidad de audio de la señal ampliada del ancho de banda puede ser mejorada en forma significativa.
[0017] Algunas formas de realización de acuerdo con la presente invención se relacionan con un aparato para proveer una señal reducida de ancho de banda basada en una señal de entrada. El aparato comprende un determinador de datos de envolvente espectral, un generador de datos de control de ajuste a escala del parche y una interfaz de salida. El determinador de datos de envolvente espectral está configurado para determinar datos de envolvente espectral basados en la banda de frecuencia alta de la señal de entrada. El generador de datos de control de ajuste a escala del parche está configurado para generar datos de control de ajuste a escala para ajustar a escala la señal reducida de ancho de banda en el decodificador o para ajustar a escala un primer parche y un segundo parche por el decodificador para que una señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral. El criterio de envolvente espectral se basa en los datos de envolvente espectral. El primer parche es generado desde una banda de baja frecuencia de la señal reducida de ancho de banda de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde una banda de baja frecuencia de la señal reducida de ancho de banda de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches. La interfaz de salida está configurada para combinar una banda de baja frecuencia de la señal de entrada, los datos de la envolvente espectral, y los datos de control de ajuste a escala de potencia para obtener la señal reducida de ancho de banda para al transmisión o almacenamiento.
[0018] Otras formas de realización de acuerdo con la presente invención se relacionan con una señal de audio que comprende una primera banda y una segunda banda. La primera banda está representada por datos de una primera resolución y la segunda banda está representada por datos de una segunda resolución. La segunda resolución es menor que la primera resolución. Los datos de la segunda resolución se basan en datos de envolvente espectral de la segunda banda y datos de control de ajuste a escala de parches de la segunda banda para ajustar a escala la señal de audio en el decodificador o para ajustar a escala un primer parche y un segundo parche por el decodificador, para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral. El criterio de envolvente espectral se basa en los datos de envolvente espectral. El primer parche es generado desde la primera banda de la señal de audio de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal de audio de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches.
[0019] Las formas de realización de acuerdo con la presente invención serán detalladas a continuación con referencia a los dibujos adjuntos, donde:
La Fig. 1 es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 2a es una ilustración esquemática de un primer parche generado; La Fig. 2b es una ilustración esquemática de un primer y segundo parche generados; La Fig. 3a es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 3b es una ilustración esquemática de una señal de entrada sinusoidal cercenado cercenada. La Fig. 3c es una ilustración esquemática de una señal de entrada sinusoidal rectificada de media onda; La Fig. 3d es una ilustración esquemática de una señal de entrada sinusoidal rectificada de media onda y onda completa; La Fig. 4 es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 5a es una ilustración esquemática de una implementación de banco de filtro de un codificador de fase operado por voz;
La Fig. 5b es una ilustración detallada de un filtro de la Fig.5a; La Fig. 5c es una ilustración esquemática para la manipulación de la señal de magnitud y la señal de frecuencia en una canal de filtro de la Fig.5a; La Fig. 6 es una ilustración esquemática de una implementación de transformación de un codificador de fase operado por voz; La Fig. 7 es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 8 es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 9 es un diagrama de bloque de un aparato para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 10 es un diagrama de bloque de un aparato para proveer una señal reducida de ancho de banda desde una señal de entrada; La Fig. 11 es un diagrama de flujo de un procedimiento para generar una señal de ancho de banda ampliado desde una señal de entrada; La Fig. 12 es un diagrama de flujo de un procedimiento para proveer una señal reducida de ancho de banda desde una señal de entrada; y La Fig. 13 es una ilustración esquemática de un algoritmo de ampliación de ancho de banda conocido.
[0020] Los mismos números de referencia que siguen se utilizan en parte para objetos y unidades funcionales con las mismas o similares propiedades funcionales y la descripción de las mismas con respecto a una figura se aplicará también a otras figuras con el fin de reducir la redundancia en la descripción de las formas de realización.
[0021] La Fig. 1 muestra un diagrama de bloque de un aparato 100 para generar una señal de ancho de banda ampliado 122 para una señal de entrada 102 de acuerdo con una forma de realización de la invención. La señal de entrada 102 está representada, para una primera banda por datos de una primera resolución, y para una segunda banda por datos de una segunda resolución, la segunda resolución es menor a la primera resolución. El aparato 100 comprende un generador de parche 110 conectado a un combinador 120. El generador de parche 120 genera un primer parche 112 desde la primera banda de la señal de entrada 102 de acuerdo con un primer algoritmo de implementación de parches y genera un segundo parche 114 desde la primera banda de la señal de entrada 102 de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche 114 generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche 112 generado de acuerdo con el primer algoritmo de implementación de parches. El combinador 120 combina el primer parche 112, el segundo parche 114 y la primera banda de la señal de entrada 102 para obtener la señal ampliada del ancho de banda 122. Además, el aparato 100 para generar una señal de ancho de banda ampliado 122 ajusta a escala la señal de entrada 102 de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o escala el primer parche 112 y el segundo parche 114 para que la señal de ancho de banda ampliado 122 cumpla con un criterio de envolvente espectral.
[0022] Densidad espectral significa, por ejemplo, la densidad de diferentes frecuencias o líneas de frecuencia dentro de una banda de frecuencia. Por ejemplo, una banda de frecuencia que alcanza de 0Hz a 10kHz y comprende porciones de frecuencia con frecuencias de 4kHz y 8kHz posee una densidad espectral menor que la misma banda de frecuencia que comprende porciones de frecuencia con frecuencias de 2kHz, 4kHz, 26kHz, 8kHz y 10kHz. Como la densidad espectral del primer parche 112 es menor a la densidad espectral del segundo parche 114, el primer parche 112 comprende espacios en comparación con el segundo parche 114. Por lo tanto, el segundo parche 114 puede utilizarse para llenar estos espacios. Como ambos parches se basan en l primera banda de la señal de entrada 102, ambos parches se relacionan con las características de al señal original correspondiente a la señal de entrada 102. Por lo tanto, señal de entrada 102 la señal ampliada del ancho de banda 122 puede ser una buena aproximación de la señal original y la calidad subjetiva o calidad de audio de la señal ampliada del ancho de banda 122 puede ser significativamente mejorada al utilizar el concepto descripto. De esta manera, se distribuye más energía entre las líneas remanentes y, por ejemplo, se puede evitar un sonido no natural.
[0023] Por ejemplo, el primer algoritmo de implementación de parches puede ser un primer algoritmo de implementación de parches armónico. Por lo tanto, el generador de parche 110 puede generar el primer parche 112 que comprende sólo las frecuencias que son múltiplos enteros de la primera banda de al señal de entrada 102. Una ampliación de ancho de banda de armónicos puede proveer una buena aproximación de la estructura tonal de al señal original, pero este algoritmo de implementación de parches dejará espacios entre las frecuencias de armónicos. Estos espacios pueden llenarse con el segundo parche. Por ejemplo, el segundo algoritmo de implementación de parches puede ser un algoritmo de implementación de parches mixto, lo que significa que el generador de parche 110 puede generar el segundo parche 114 que comprende múltiplos enteros de frecuencias de la primera banda de la señal de entrada 102 (frecuencias de armónicos) y frecuencias que no son múltiplos enteros de frecuencias de la primera banda de la señal de entrada 102 (frecuencias no armónicas). Las frecuencias no armónicas pueden ser utilizadas para llenar los espacios del primer parche 112. Es posible también combinar todo el segundo parche 114 (incluyendo las frecuencias de armónicos) con el primer parche 112. En este ejemplo, una amplificación de las frecuencias de armónicos debido a la combinación de las porciones de frecuencia de armonía
del primer parche 112 y segundo parche 114 pueden tomarse en cuenta ajustando a escala en forma apropiada el primer parche 112 y/o segundo parche 114. [0024] El primer parche 112 y el segundo parche 114 comprenden al menos parcialmente el mismo rango de frecuencia. Por ejemplo, el primer parche 112 comprende una banda de frecuencia que alcanza de 4kHz a 8kHz y el segundo parche 114 comprende una banda de frecuencia que alcanza de 6kHz a 10kHz. En algunas formas de realización de acuerdo con la presente invención, una frecuencia de corte inferior del primer parche es igual a la frecuencia de corte inferior del segundo parche y una frecuencia de corte superior del primer parche 112 es igual a la frecuencia de corte superior del segundo parche 114. Por ejemplo, ambos parches comprenden una banda de frecuencia que alcanza de 4kHz a 8kHz.
[0025] Las Figs. 2a y 2b muestran un ejemplo para un primer parche 112 de acuerdo con un primer algoritmo de implementación de parches 212 y un segundo parche 114 de acuerdo con un segundo algoritmo de parche 214. Para una mejor ilustración, la Fig. 2a muestra sólo los primeros parches 112 y la Fig. 2b muestra los primeros parches 112 y los segundos parches 114 correspondientes. La Fig. 2a ilustra un ejemplo 200 para la primera banda 202 de la señal de entrada 102 y dos primeros parches 112 generados de acuerdo con un primer algoritmo de implementación de parches 212. En este ejemplo, un parche comprende el mismo ancho de banda como la primera banda 202 de la señal de entrada 102. El ancho de banda puede ser también diferente. La frecuencia de corte
superior 220 de la primera banda 202 de la señal de entrada 102 se denota como frecuencia “X” (frecuencia de
cruce). En el Ejemplo de la Fig. 2a, los parches comienzan a una frecuencia igual a un múltiplo de la frecuencia de cruce X 220. Las líneas de frecuencia dentro de los primeros parches 112 son múltiplos enteros de las líneas de frecuencia de la primera banda 202 e la señal de entrada 102 y puede, por ejemplo, ser generada por un codificador de fase operado por voz. Estos primeros parches 112 comprenden espacios en términos de líneas de frecuencia ausentes en comparación con la primera banda 202 e la señal de entrada 102.
[0026] La Fig. 2b muestra además un ejemplo 250 para los dos parches 114 correspondientes. Estos parches son generados de acuerdo con el segundo algoritmo de parche 214 y comprenden frecuencias de armónicos y no de armónicos. Las líneas de frecuencia no de armónicos pueden utilizarse para llenar los espacios de los primeros parches 112. Las líneas de frecuencia de los segundos parches 114 pueden ser generados por ejemplo por una distorsión no lineal.
[0027] De esta manera, los espacios pueden no ser llenados en forma arbitraria como, por ejemplo, llenando espacios con ruido. Los espacios se llenan basándose en la señal de entrada y, por lo tanto, basándose en la señal original.
[0028] La primera banda de la señal de entrada 102 puede representar, por ejemplo, la banda de frecuencia baja de una señal de audio original codificada con alta resolución. La segunda banda de la señal de entrada 102 puede representar, por ejemplo, la banda de frecuencia alta de una señal de audio original y puede ser cuantizada por uno
o más parámetros, como por ejemplo, datos de envolvente espectral, datos de ruido y/o datos de armonía perdidos con baja resolución. Una señal de audio original puede ser, por ejemplo, una señal de audio grabada por un micrófono antes del procesamiento o codificación.
[0029] El ajuste a escala de la señal de entrada de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches significa, por ejemplo, que la señal de entrada es ajuste a escala una vez de acuerdo con el primer algoritmo de implementación de parches antes que el primer parche sea generado y luego el primer parche es generado teniendo en cuenta la señal de entrada ajuste a escala, y que la señal de entrada es ajustada a escala una vez de acuerdo con el segundo algoritmo de implementación de parches antes que el segundo parche sea generado y luego el segundo parche es generado teniendo en cuenta la señal de entrada ajuste a escala, para que después de la combinación del primer parche, el segundo parche y la primera banda de la señal de entrada , la señal de ancho de banda ampliado cumple con un criterio de envolvente espectral. En forma alternativa, el primer parche y el segundo parche son ajustados a escala después de su generación, para que la señal de ancho de banda ampliado cumpla también con un criterio de envolvente espectral. Es también posible un ajuste a escala de la señal de entrada de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches en combinación con un ajuste a escala del primer parche y el segundo parche.
[0030] El combinador 120 puede ser, por ejemplo, un sumador y la señal de ancho de banda ampliado puede ser una suma ponderada del primer parche 112, el segundo parche 114 y la primera banda de la señal de entrada 102.
[0031] Cumplir con un criterio de envolvente espectral significa, por ejemplo, que una envolvente espectral de la señal de ancho de banda ampliado se basa en datos de envolvente espectral contenidos por la señal de entrada. Los datos de envolvente espectral pueden ser generados por un codificador y pueden representar la segunda banda de una señal original. De esta manera, la envolvente espectral de la señal de ancho de banda ampliado puede ser una buena aproximación de la envolvente espectral de la señal original.
[0032] El aparato 100 puede también comprender un decodificador de núcleo para decodificar la primera banda de la señal de entrada 102.
[0033] El generador de parche 110 y el combinador 120 pueden ser hardware especialmente diseñado o parte de un procesador o micro controlador o un programa de ordenador configurado para ser utilizado en una computadora o micro controlador. El aparato 100 puede ser parte de un decodificador o codificador de voz.
[0034] La Fig. 3a muestra un diagrama de bloque de un aparato 300 para generar una señal de ancho de banda ampliado 122 desde una señal de entrada 102 de acuerdo con una forma de realización de la invención. En este ejemplo, el generador de parche 110 comprende un codificador de fase operado por voz 310 para generar el primer parche y un recortador de amplitud 320 para generar el segundo parche 114. El codificador de fase operado por voz 310 y el recortador de amplitud 320 están conectados al combinador 120. El codificador de fase operado por voz 310 puede expandir la primera banda de la señal de entrada de audio 102 para generar el primer parche 112 que comprende frecuencias de armónicos. En un paso de procesamiento no lineal, recortador de amplitud 320 puede recortar la señal de entrada de audio 102 para generar el segundo parche 114 que comprende frecuencias de armónicos y no de armónicos. De manera alternativa al recortador de amplitud 320, un rectificador de media onda, un rectificador de onda completa, un mezclador o diodo utilizado en al región cuadrática de la curva característica pueden utilizarse para generar frecuencias no de armónicos basadas en la señal de entrada de audio 102 por medio de un paso de procesamiento no lineal.
[0035] Las Figs. 3b, 3c y 3d muestran ejemplos de señales de entrada recortadas y/o rectificadas 102 para generar frecuencias no de armónicos. La Fig. 3b muestra una ilustración esquemática 350 de una señal de entrada sinusoidal recortada 102. Al recortar la señal, se originan puntos de discontinuidad en la forma de cambios abruptos de la inclinación de señal 380 y se generan porciones de armónicos y no de armónicos con altas frecuencias.
[0036] En forma alternativa, la Fig. 3c muestra una ilustración esquemática 360 e una señal de entrada sinusoidal rectificada de media onda 102, causando también puntos de discontinuidad 380.
[0037] Además, una combinación de recorte o rectificación puede ser posible. La Fig. 3d muestra una ilustración esquemática 370 de una señal de entrada sinusoidal rectificada de onda completa 102 causando diferentes puntos de discontinuidad 380.
[0038] Al recortar y/o rectificar o aplicar otros procedimientos de procesamientos no lineales que generan puntos de discontinuidad 380, se puede generar un gran espectro de diferentes frecuencias. Por lo tanto, un parche generado de acuerdo con dicho algoritmo de implementación de parches puede comprender una alta densidad espectral.
[0039] La Fig. 4 muestra un diagrama de bloque de un aparato 400 para generar una señal de ancho de banda ampliado 122 desde una señal de entrada 102 de acuerdo con una forma de realización de la invención. El aparato 400 es similar al aparato de la Fig. 3a, pero comprende además un selector de línea espectral 410. El codificador de fase operado por voz 310 y el recortador de amplitud 320 se conectan al selector de línea espectral 410 y el selector de línea espectral 410 está conectado al combinador 120. El selector de línea espectral 410 puede seleccionar una pluralidad de líneas de frecuencia del segundo parche 114 para obtener un segundo parche modificado 414 que puede ser complementaria al primer parche. Una línea de frecuencia del segundo parche 114 puede seleccionarse si se pierde una línea de frecuencia correspondiente al primer parche 112. En otras palabras, el selector de línea espectral 410 selecciona líneas de frecuencia del segundo parche 114 para llenar los espacios del primer parche
112. De esta manera, el segundo parche modificado 414 puede comprender espacios en frecuencias ya contenidas por el primer parche 112.
[0040] En este ejemplo, el combinador 120 combina el primer parche 112, el segundo parche modificado 414 y al primera banda de la señal de entrada 102.
[0041] El selecto de línea espectral 410 puede ser, por ejemplo, parte del generador de parche 110 (como lo muestra la Fig. 4) o una unidad separada.
[0042] A continuación, con referencia a las Figs, 5 y 6, se ilustran posible implementaciones para un codificador de fase operado por voz, donde una señal de audio es suministrada a una entrada 500 y obtenida en una salida 510. En particular, cada canal del banco de filtro esquemático ilustrado en la Fig. 5a incluye un filtro de paso de banda 501 y un oscilador de flujo descendente 502. Las señales de salida de todos los osciladores desde cada canal son combinadas por un combinador, que, por ejemplo, es implementada como sumador e indicado en 503 con el fin de obtener la señal de salida. Cada filtro 501 es implementado de modo que provea una señal de amplitud por un lado y una señal de frecuencia por otro lado. La señal de amplitud y la señal de frecuencia son señales de tiempo que ilustran un desarrollo de la amplitud en un filtro 501 en el tiempo, mientras que la señal de frecuencia representa un desarrollo de la frecuencia de la señal filtrada por un filtro 501.
[0043] Una disposición esquemática del filtro 501 se ilustra en la Fig. 5b. Cada filtro 501 de la Fig. 5a puede disponerse como en la Fig. 5b, donde sin embargo, sólo las frecuencias fi suministradas a los dos mezcladores de entrada 551 y el sumador 552 difieren de canal a canal. Las señales de salida mezcladas de los mezcladores 551 son de paso bajo filtradas por pasos bajos 553, donde las señales de paso bajo son diferentes siempre que sena generadas por frecuencias de un oscilador local (frecuencias OL), las que se encuentran fuera de fase por 90º. El filtro de paso bajo superior 553 provee una señal de cuadratura 554, mientras que el filtro inferior 553 provee una señal en fase 555. Estas dos señales, es decir Q e I son suministradas a un transformador coordinado 556 que genera una representación de magnitud- fase desde la representación rectangular. La señal de magnitud o señal de amplitud, respectivamente, de la Fig. 5a con el tiempo es emitida en una salida 557. La señal de fase es suministrada a un desplegador de fase 558. En la salida del elemento 558, no hay más valor de fase presente,
siempre entre 0 y 360º, sino un valor de fase, que aumenta en forma lineal. Este valor de fase “desplegado” es
suministrado a un convertidos de fase/frecuencia 559 que, por ejemplo, puede por ejemplo, ser implementado como un calculador de diferencia de fase simple, que substrae una fase de un punto previo en el tiempo desde una fase en un punto actual en el tiempo para obtener un valor de frecuencia para el punto actual en el tiempo u otro medio para obtener una aproximación de una derivativa de fase. Este valor de frecuencia es agregado al valor de frecuencia constante fi del canal de filtro i para obtener un valor de frecuencia de variación temporal en al salida 560. El valor de frecuencia en la salida 560 tiene un componente directo = fi y un componente alternativo = a la desviación de frecuencia por la cual una frecuencia actual de la señal en el canal de filtro se desvía de la frecuencia promedio fi.
[0044] En consecuencia, como se ilustra en la Figs. 5a y 5b, el codificador de fase operado por voz logra una separación de la información espectral y la información temporal. La información espectral está contenida en el canal espectral o en la frecuencia fi> que provee la porción directa de la frecuencia para cada canal, mientras que la información temporal está contenida en la desviación de frecuencia o evolución de magnitud en el tiempo, respectivamente.
[0045] La Fig. 5c. muestra una manipulación como se ejecuta para la generación del primer parche de acuerdo con la invención, en particular, utilizando el codificador de fase operado por voz 310 y, con más detalle, insertado en la posición de la línea de puntos y rayas del circuito ilustrado de al Fig 5a.
[0046] Para ajustes a escala de tiempo, por ejemplo señales de amplitud A(t) en cada canal o la frecuencia de las señales f(t) en cada canal puede ser diezmado o interpolado. Para propósitos de transposición, útiles para la presente invención, una interpolación, es decir una ampliación temporal o expansión de las señales A(t) y f(t) es realizada para obtener señales de expansión A´(t) y f´(t), donde la interpolación es controlada por el factor de expansión 598. El factor de expansión puede ser seleccionado, por ejemplo, para que el codificador de fase operado por voz genere frecuencias de armónicos. Mediante la interpolación de la variación de fase, es decir el valor antes del agregado de la frecuencia constante por medio del sumador 552, la frecuencia de cada oscilador individual 502 en la Fig. 5a no cambia. El cambio temporal de la señal de audio total es desacelerado, sin embargo, es decir por el factor 2. El resultado es un tono de expansión temporal con un tono temporal, es decir, la onda fundamental original con su armonía.
[0047] Al realizar el procesamiento de señal ilustrado en al Fig. 5c, la señal de audio puede retractarse a su duración original, por ejemplo diezmando un factor 2, mientras que todas las frecuencias son duplicadas en forma simultánea. Esto conduce una transposición de tono por el factor 2 donde, sin embargo, se obtiene una señal de audio con la misma longitud que la señal de audio original, es decir, la misma cantidad de muestras.
[0048] Como alternativa de la implementación de al banda de filtro ilustrada en la Fig. 5a, una implementación de transformación de un codificador de fase operado por voz puede ser utilizado también como se representa en la Figura 6. En este caso, la señal de audio 698 es suministrada en un procesador FFT, o en general, en un procesador de Transformada de Fourier de Corto Plazo (STFT, por su sigla en inglés) 600 como secuencia de muestras de tiempo. El procesador FFT 600 es implementado para realizar una operación de ventana temporal de una señal de audio con el fin de, por medio de una FFT subsiguiente, calcular un espectro de magnitud y un espectro de fase, donde este cálculo es realizado para espectros sucesivos relacionados con bloques de la señal de audio que están fuertemente superpuestos.
[0049] En un caso extremo, para cada muestra de señal de audio un nuevo espectro puede ser calculado, donde un
nuevo espectro puede ser calculado también, por ejemplo sólo para cada vigésima nueva muestra. Esta distancia “a”
en muestras entre dos espectros es preferentemente dada por un controlador 602. El controlador 602 es además implementado para suministrar un procesador IFFT 604 implementado para operar en una operación de superposición-suma. En particular, el procesador IFFT 604 es implementado de modo que realice una Transformada de Fourier de Corto Plazo al realizar una IFFT por espectro basada en un espectro de magnitud y un espectro de fase, con el fin de realizar luego una operación de superposición-suma para obtener la señal de tiempo resultante. La operación de superposición-suma está configurada para eliminar los efectos bloqueadores introducidos por la ventana de análisis.
[0050] Una expansión temporal de la señal e tiempo se logra mediante la distancia “b” entre dos espectros, a medida que son procesados por el procesador IFFT 604, siendo mayor que al distancia “a” entre los espectros utilizados en al generación de los espectros FFT. La idea básica consiste en expandir la señal de audio mediante las FFTs inversas simplemente más separadas que el análisis FFT. En consecuencia, los cambios espectrales en la señal de audio sintetizada ocurren más lentamente que en la señal de audio original.
[0051] Sin un ajuste a escala de fase en el bloque 606, sin embargo, esto conduciría a artefactos de frecuencia. Cuando, por ejemplo, se considera un sólo recolector de frecuencia (frequency bin) para el cual se implementan sucesivos valores de fase por 45º, esto implica que la señal dentro de esta banda de filtro aumenta en la fase con una relación de 1/8 de un ciclo, es decir por 4º por intervalo de tiempo, donde el intervalo de tiempo acá es el intervalo de tiempo entre sucesivas FFTs. Si ahora las FFTs inversas se encuentran muy separadas entre sí, significa que el aumento de fase en 45º ocurre a través de un intervalo de tiempo largo. Esto significa que la frecuencia de esta porción de señal fue modificada sin intención. Para eliminar este artefacto, la fase es re-ajustada a escala por exactamente el mismo factor por el cual la señal de audio fue expandida a tiempo. La fase de cada valor espectral de FFT es así incrementada por el factor b/a, para que esta modificación de frecuencia no intencional sea eliminada.
[0052] Mientras que en la forma de realización ilustrada en al Fig. 5c la expansión por interpolación de las señales de control de amplitud/frecuencia fue lograda por un oscilador de señal en la implementación del banco de filtro de la Fig 5 a, al expansión en la Fig 6 es lograda por al distancia entre dos espectros IFFT mayores a la distancia ente dos espectros FFT, es decir, “b” es mayor que “a”, donde, sin embargo para prevención de un artefacto un re-ajuste a escala de fase se ejecuta de acuerdo con la relación ”b/a”. La distancia “b” pude seleccionarse, por ejemplo, para
que el codificador de fase operado por voz genere frecuencias de armónicos.
[0053] La Fig. 7 muestra un diagrama de bloque de un aparato 700 para generar una señal de ancho de banda ampliado 122 desde una señal de entrada 102 de acuerdo con una forma de realización de al invención. El aparato 700 es similar al aparato de la Fig. 1, pero comprende un controlador de potencia 710, un primer medio de ajuste de potencia 720 y un segundo medio de ajuste de potencia 730. El controlador de potencia 710 está conectado al primer medio de ajuste de potencia 720 y el segundo medio de ajuste de potencia 730 está conectado con el generador de parche 110. El controlador de potencia 710 puede controlar el ajuste a escala de la señal de entrada de acuerdo con el primer y segundo algoritmo de implementación de parches basado en datos de envolvente espectral contenidos por la señal de entrada y basado en datos de control de implementación de parches contenidos por la señal de entrada. De manera alternativa, en vez de datos de control de ajuste a escala del parche contenidos por la señal de entrada, se puede utilizar al menos un parámetro de control de ajuste a escala del parche. Un parámetro de control de ajuste a escala del parche puede ser almacenado por una memoria de parámetro de control de ajuste a escala del parche, que puede ser parte del controlador de potencia 710 o una unidad separada. El primer medio de ajuste de potencia 720 puede ajustar a escala la señal de entrada 102 de acuerdo con el primer algoritmo de implementación de parches y el segundo medio de ajuste de potencia 730 puede ajustar a escala la señal de entrada 102 de acuerdo con el segundo algoritmo de implementación de parches. En otras palabras, la señal de entrada 102 puede ser pre-procesada, para que el primer y segundo parche puedan ser generados, para que la señal de ancho de banda ampliado cumpla con el criterio de envolvente espectral. Para esto, los datos de envolvente espectral pueden definir la envolvente espectral de la señal de ancho de banda ampliado 122 y los datos de control de ajuste a escala del parche o parámetro de control de ajuste a escala del parche pueden determinar la relación entre el primer parche 112 y el segundo parche 114 o pueden determinar los valores absolutos del primer parche 112 y/o segundo parche 114. El primer medio de ajuste de potencia 720 y el segundo medio de ajuste de potencia 730 pueden ser parte del controlador de potencia 710 o unidades separadas como se muestran en la Fig 7. El controlador de potencia 710 puede ser parte del generador de parche 110 o una unidad separada como se muestra también en la Fig 7. Los medios de ajuste de potencia 720, 730 pueden ser, por ejemplo, amplificadores o filtros controlados por el controlador de potencia 710.
[0054] En forma alternativa, el ajuste a escala se realiza después de la generación de los parches. En forma adecuada la Fig. 8 muestra un diagrama de bloque de un aparato 800 para generar la señal de ancho de banda ampliado 122 desde una señal de entrada 102 de acuerdo con una realización de la invención. El aparato 800 es similar al aparato de la Fig. 7, pero los medios de ajuste de potencia 720, 730 se disponen entre el generador de parche 110 y el combinador 120. En este ejemplo, el generador de parche 110 está conectado al primer medio de ajuste de potencia 720 y conectado al segundo medio de ajuste de potencia 730. El primer medio de ajuste de potencia 720 y el segundo medio de ajuste de potencia 730 están conectados al combinador 120. De esta manera, el primer parche 112 puede ser ajustado a escala por el primer medio de ajuste de potencia 720 de acuerdo con el primer algoritmo de implementación de parches y el segundo parche 114 puede ser ajustado a escala por el segundo medio de ajuste de potencia 730 de acuerdo con el segundo algoritmo de implementación de parches. Los medios de ajuste de potencia son nuevamente controlaos por el controlador de potencia 710 basado en los datos de al envolvente espectral y los datos de control del ajuste a escala del parche o el parámetro de control del ajuste a escala del parche como se describe anteriormente.
[0055] En forma alternativa, se puede realizar también un ajuste a escala de sólo uno de los dos parches seguido de una combinación de los parches por el combinador 120 y realzando un ajuste a escala de los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada 102. En otras palabras, el primer parche puede ser ajustado a escala para realizar una relación (por ejemplo, basado en los datos de control del ajuste a escala del parche) entre dos parches y luego se ajustan a escala los parches combinados (por ejemplo, basados en los datos de envolvente espectral) para cumplir con el criterio de envolvente espectral.
[0056] Los datos de control del ajuste a escala del parche pueden comprender, por ejemplo, un factor simple o una pluralidad de parámetros para un ajuste a escala de distribución de potencia. Los datos de control del ajuste a escala del parche pueden indicar, por ejemplo, una relación de potencia entre el primer parche y el segundo parche por toda la segunda banda o banda de frecuencia alta completa o un valor absoluto para la potencia del primer parche y/o segundo parche por toda la segunda banda o banda de frecuencia alta completa y pueden estar representados por al menos un parámetro. De manera alternativa, los datos de control del ajuste a escala del parche comprenden un factor para cada pluralidad de sub-bandas que constituyen en forma conjunta la segunda banda o banda de frecuencia alta, por ejemplo, similares a los datos de envolvente espectral por sub-banda en aplicaciones de replicación de ancho de banda espectral. De manera alternativa, los datos de control del ajuste a escala del parche pueden indicar además una función de transferencia de un filtro. Por ejemplo, los parámetros de una función de transferencia de un filtro para el ajuste a escala del primer parche y/o parámetros de una función de transferencia de un filtro para el ajuste a escala del segundo parche pueden estar contenidos en la señal de entrada. De esta manera, los parámetros pueden representar una función de frecuencia. Otra alternativa pueden ser parámetros de control de ajuste a escala de parches que representan una función diferencial del primer parche y segundo parche. De acuerdo con estos ejemplos, el ajuste a escala de la señal de entrada o el ajuste a escala del primer parche y segundo parche pueden basarse en los datos de control de ajuste a escala del parche que comprenden al menos un parámetro.
[0057] La Fig. 9 muestra un diagrama de bloque de un aparato 900 para generar una señal de ancho de banda ampliado 122 desde una señal de entrada 102 de acuerdo con una realización de la invención. El aparato 900 es similar al aparato de la Fig. 8, pero comprende además un sumador de ruido 910, un sumador de armonía perdida 920, un medio de ajuste de potencia de ruido 940 y un medio de ajuste de potencia de armonía perdida 950. El sumador de ruido 910 está conectado al medio de ajuste de potencia de ruido 940 conectado al combinador 120. El sumador de armonía perdida 920 está conectado al medio de ajuste de potencia de armonía perdida 950, conectado al combinador 120. Además, el controlador de potencia 710 está conectado al medio de ajuste de potencia de ruido 940 y al medio de ajuste de potencia de armonía perdida 950. El sumador de ruido 910 puede generar un parche de ruido 912 basado en datos de ruido contenidos por señal de entrada 102.
[0058] El parche de ruido 912 puede ajustarse a escala por el medio de ajuste de potencia de ruido 940. El controlador de potencia 710 puede controlar el medio de ajuste de potencia de ruido 940 basado en los datos de envolvente espectral y/o datos de ajuste a escala de ruido en la señal de entrada 102. De esta manera. El ruido de una señal original puede ser aproximado para mejorar la calidad de audio de la señal ampliada de banda de ancho.
[0059] El sumador de armónicos ausentes 920 puede generar un parche de armónicos ausentes 922 basado en los datos de armónicos ausentes contenidos en la señal de entrada. El parche de armónicos ausentes 922 puede contener frecuencias de armónicos, que sólo pueden ocurrir en la banda de frecuencia alta de la señal original y, por lo tanto, no pueden ser reproducidas, si sólo se encuentra disponible la información de la banda de frecuencia baja de la señal original en términos de la primera banda de la señal de entrada 102. Los datos de armónicos ausentes pueden proveer información acerca de estos armónicos ausentes. El parche armónicos ausentes 922 puede ajustarse a escala por el medio de ajuste de potencia de armonía perdida 950. El controlador de potencia 710 puede controlar el medio de ajuste de potencia de armonía perdida 950 teniendo en cuenta los datos de envolvente espectral o datos de ajuste de escala de armonía perdida por la señal de entrada 102.
[0060] El combinador 120 puede combinar el primer parche 112, el segundo parche 114, la primera banda de la señal de entrada 102. El parche de ruido 912 y el parche de armonía perdida 922 para obtener la señal de ancho de banda ampliado 122. El controlador de potencia 710, en combinación con los medios de ajuste de potencia, pueden ajustar a escala al primer parche 112, el segundo parche 114, el parche de ruido 912 y el parche de armonía perdida 922 teniendo en cuenta los datos de envolvente espectral, para que el criterio de envolvente espectral pueda ser cumplido.
[0061] La Fig. 10 muestra un diagrama de bloque de un aparato 1000 para proveer una señal reducida de ancho de banda 1032 teniendo en cuenta una señal de entrada 1002 de acuerdo con una realización de al invención. El aparato 1000 comprende un determinador de datos de envolvente espectral 1010, un generador de datos de control de ajuste a escala del parche 1020 y una interfaz de salida 1030. El determinador de datos de envolvente espectral 1010 y el generador de datos de control de ajuste a escala del parche 1020 están conectados a la interfaz de salida 1030. El determinador de datos de envolvente espectral 1010 puede determinar datos de envolvente espectral 1012 teniendo en cuenta una banda de frecuencia alta de la señal de entrada 1002. El generador de datos de control de ajuste a escala del parche 1020 puede generar datos de control de ajuste a escala del parche 1022 para ajustar a escala la señal reducida de ancho de banda 1032 en un decodificador o para ajustar a escala un primer parche y un segundo parche, por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral. El criterio de se basa en datos de envolvente espectral. El primer parche es generado desde una primera banda de la señal reducida de ancho de banda 1032 de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal reducida de ancho de banda 1032 de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches. La interfaz de salida 1030 combina una banda de frecuencia baja de la señal de entrada 1002, los datos de envolvente espectral 1012 y datos de control de ajuste a escala del parche 1022 para obtener la señal reducida de ancho de banda 1032. Además, la interfaz de salida 1030 provee la señal reducida de ancho de banda 1032 para su transmisión o almacenamiento.
[0062] El aparato 1000 puede comprender también un codificador de núcleo para codificador la banda de frecuencia baja de la señal de entrada. El codificador de núcleo puede, por ejemplo, un codificador diferencial, un codificador de entropía o un codificador de audio perceptivo.
[0063] El aparato 1000 puede ser parte de un codificador para proveer una señal para un decodificador descripto anteriormente. Los datos de control de ajuste a escala del parche 1022 pueden comprender por ejemplo, un factor simple o una pluralidad de parámetros para un ajuste a escala de distribución de potencia. Los datos de control de ajuste a escala del parche pueden indicar por ejemplo, una relación de potencia entre el primer parche y el segundo parche en toda la banda de frecuencia alta o un valor absoluto para la potencia del primer parche y/o el segundo parche en toda la banda de frecuencia alta y pueden ser representados por al menos un parámetro. En forma alternativa, los datos de ajuste a escala del parche comprenden un factor determinado para cada una de las pluralidades de sub-bandas que constituyen en forma conjunta la banda de frecuencia alta, por ejemplo, similar a los datos de envolvente espectral por sub-banda en aplicaciones de replicación de ancho de banda. Por ejemplo, los parámetros de una función de transferencia de un filtro para ajustar a escala el primer parche y/o parámetros de una función de transferencia de un filtro para ajustar a escala el segundo parche pueden determinarse para generar los datos de control de ajuste a escala del parche. De esta manera, los parámetros pueden generar parámetros de control de ajuste a escala del parche representan una función diferencial del primer parche y el segundo parche.
[0064] Los datos de control de ajuste a escala del parche 1022 pueden ser generados analizando la señal de entrada 1002 y seleccionando los parámetros de control de ajuste a escala del parche almacenados en una memoria de parámetros de control de ajuste a escala del parche basados en el análisis de la señal de entrada 1002 para obtener los datos de control de ajuste a escala del parche 1022.
[0065] De forma alternativa, la generación de datos de control de ajuste a escala del parche 1022 puede realizarse mediante un análisis por enfoque de síntesis. Para ello, el generador de datos de control de ajuste a escala del parche 1020 puede comprender además un generador de parche (como se describe para el decodificador) y un comparador. El generador de parche puede generar un primer parche desde la banda de baja frecuencia de la señal de entrada 1002 de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con un segundo algoritmo de implementación de parches puede ser mayor que la densidad espectral del primer parche generado de acuerdo con un primer algoritmo de implementación de parches. El comparador puede comparar el primer parche, el segundo parche y la banda de frecuencia alta de la señal de entrada para obtener los datos de control de ajuste a escala del parche 1022. En otras palabras, el concepto descripto antes se aplica también al aparato 1000. De esta manera, el aparato 1000 puede extraer los datos de control de ajuste a escala del parche 1022 comparando los parches o parches combinados con la señal de entrada, que puede por ejemplo, ser una señal de audio original. Además, el aparato 1000 puede comprender también un selector de línea espectral, un controlador de potencia, un sumador de ruido y/o un sumador de armonía perdida como se describe anteriormente. De esta manera, también los datos de ruido, los datos de control de ajuste a escala del parche de ruido, los datos de armonía perdida y/o datos de control de ajuste a escala del parche de armonía perdida pueden ser extraídos mediante el procedimiento de análisis por síntesis.
[0066] Algunas formas de realización de acuerdo con la invención se relacionan con la señal de audio que comprende una primera banda y una segunda banda. La primera banda se representa por datos de una primera resolución y la segunda banda se representa por datos de una segunda resolución, donde la segunda resolución es menor a la primera resolución. Los datos de la segunda resolución se basan en datos de envolvente espectral de la segunda banda y los datos de control de ajuste a escala del parche de la segunda banda para ajustar a escala la señal de audio en un decodificador o para ajustar a escala un primer parche y un segundo parche por un decodificador, para que una señal de ancho de banda ampliado generada por el decodificador cumple con un criterio de envolvente espectral. El criterio de envolvente espectral se basa en los datos de envolvente espectral. El primer parche es generado desde la primera banda de la señal de audio de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal de audio de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches.
[0067] La señal de audio puede, por ejemplo, ser una señal reducida de ancho de banda basada en la señal de audio original. La primera banda de la señal de audio puede representar una banda de baja frecuencia de la señal de audio original codificada con alta resolución. La segunda banda de la señal de audio puede representar una banda de alta frecuencia de la señal de audio original y puede ser cuantizada al menos por dos parámetros, un parámetro de envolvente espectral representado por los datos de envolvente espectral y un parámetro de control de ajuste a escala de parche representado por los datos de control de ajuste a escala de parche. Teniendo en cuenta dicha señal de audio, un decodificador de acuerdo con el concepto descripto anteriormente puede generar una señal de ancho de banda ampliado que provee una buena aproximación de la señal de audio original con calidad de audio mejorada en comparación con conceptos conocidos.
[0068] La Fig. 11 muestra un diagrama de flujo de un procedimiento 1100 para generar una señal de ancho de banda ampliado desde una señal de entrada de acuerdo con una realización de la invención. La señal de entrada está representada, para una primera banda por datos de una primera resolución, y para una segunda banda por datos de una segunda resolución, la segunda resolución es menor a la primera resolución. El procedimiento 1100 comprende la generación 1110 de un primer parche, la generación 1120 de un segundo parche, el ajuste a escala 1130 de la señal de entrada o ajuste a escala 1130 del primer parche y segundo parche y la combinación 1140 del primer parche, segundo parche y primera banda de la señal de entrada para obtener la señal de ancho de banda ampliado. El primer parche es generado 1110 desde la primera banda de la señal de entrada de acuerdo con un primer algoritmo de implementación de parches y la segunda banda es generada 1120 desde la primera banda de la señal de entrada de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado 1120 de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado 1110 de acuerdo con el primer algoritmo de implementación de parches. La señal de entrada puede ajustarse a escala 1130 de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o el primer parche y segundo parche pueden ajustarse a escala 1130, para que la señal de ancho de banda ampliado cumpla con un criterio de envolvente espectral.
[0069] Además, el procedimiento 1100 puede ampliarse por medio de pasos de acuerdo con el concepto descripto anteriormente. El procedimiento 1100 puede, por ejemplo, desarrollarse como un programa de ordenador para utilizar en una computadora o micro-controlador.
[0070] La Fig. 12 muestra un diagrama de flujo de un procedimiento 1200 para proveer una señal reducida de ancho de banda basada en una señal de entrada de acuerdo con una realización de la invención. El procedimiento 1200 comprende la determinación 1210 de datos de envolvente espectral basados en una banda de alta frecuencia de la señal de entrada, la generación 1220 de datos de control de ajuste a escala del parche, la combinación 1230 de la banda de baja frecuencia de la señal de entrada, datos de envolvente espectral y datos de control de ajuste a escala del parche para obtener la señal reducida de ancho de banda y la provisión 1240 de la señal reducida de ancho de banda para u transmisión o almacenamiento. Los datos de control de ajuste a escala del parche son generados 1220 para ajustar a escala la señal reducida de ancho de banda en un decodificador o para ajustar a escala un primer parche y segundo parche por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral. El criterio de envolvente espectral se basa en los datos de envolvente espectral. El primer parche es generado desde una banda de frecuencia baja de la señal reducida de ancho de banda de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la banda de baja frecuencia de la señal reducida de ancho de banda de acuerdo con un segundo algoritmo de implementación de parches. Una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches.
[0071] Además, el procedimiento 1200 puede ampliarse mediante los pasos de acuerdo al concepto descripto anteriormente. El procedimiento 1200 puede ser, por ejemplo, desarrollarse como un programa de ordenador para utilizar en una computadora o micro-controlador.
[0072] Algunas formas de realización de acuerdo con la presente invención se relacionan con un aparato para generar una señal de ancho de banda ampliado que utiliza un codificador de fase operado por voz para ampliación de ancho de banda combinado con una distorsión no lineal o relleno de ruido para un espectro más denso. Al aplicar este codificador de fase operado por voz para la expansión espectral, las líneas de frecuencia se separan. Si existen espacios en el espectro, por ejemplo, por cuantización, los mismos se incrementan por la expansión. En una adaptación de energía, las líneas que permanecen en el espectro reciben demasiada energía. Esto se evita llenando los espacios, con ruido u otras armónicos, obtenidos por una distorsión no lineal de al señal. De esta manera, más energía puede ser distribuida entre las líneas restantes. Mediante la concentración de energía en bandas para sólo pocas líneas de frecuencia, da por resultado un sonido no natural o metálico. La energía de bandas anteriores se suma a las restantes.
[0073] Si no existen espacios en el espectro, pero, al menos, ruido se encuentra presente, parte de al energía permanece en el piso de ruido. Al aplicar la distorsión no lineal, el espectro puede ser nuevamente densificado por un lado por el ruido producido por la distorsión, por otro lado por otras porciones de armonía reguladas por una selección apropiada de la porción de señal a ser distorsionada.
[0074] La señal de ancho de banda ampliado puede ser, por ejemplo una suma ponderada de una señal filtrada distorsionada, generada con ayuda de un codificador de fase operado por voz. En otras palabras, la señal de ancho de banda ampliado puede ser una suma ponderada del primer parche, el segundo parche y la primera banda de la señal de entrada.
[0075] Algunas formas de realización de acuerdo con la presente invención se relacionan con un concepto apropiado para todas las aviaciones de audio onde todo el acho de banda no se encuentra disponible. Por ejemplo, para la difusión de los contenidos de audio que utilizan servicios de radio digital, Internet streaming u otras aplicaciones de comunicación de audio, se puede aplicar el concepto descripto.
5 [0076] Mientras que la presente invención ha sido descripta en términos de distintas formas de realización, existen alteraciones, cambios y equivalencias que se encuentran dentro del alcance de la presente invención. Debería observarse además que existen maneras alternativas para implementar los procedimientos y composiciones de la presente invención. Por lo tanto las siguientes reivindicaciones adjuntas intentan ser interpretadas como que
10 incluyen dichas alteraciones, cambios y equivalencias dentro del alcance y espíritu verdadero de la presente invención.
[0077] En particular, se observa, dependiendo de las condiciones, que el esquema de al invención puede implementarse también en software. La implementación puede realizarse en un medio de almacenamiento digital, 15 particularmente un disquete o un CD con señales de control susceptibles de se leídas en forma electrónicas capaces de cooperar con un sistema de computación programable para que el procedimiento correspondiente sea ejecutado. En general, la invención también consiste por lo tanto en un producto de programa de ordenador con un código de programa almacenado en un portador susceptible de se leído por una máquina para desarrollar el procedimiento de la inventiva, cuando el producto de programa de ordenador es ejecutado en una computadora. En otras palabras, la
20 invención puede desarrollarse también como un programa de ordenador con un código de programa para desarrollar el procedimiento, cuando el producto de programa de ordenador es ejecutado en una computadora.

Claims (16)

  1. REIVINDICACIONES
    1. Un aparato (100; 300; 400; 700; 800; 900) para generar una señal de ancho de banda ampliado (122) desde una señal de entrada (102), donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el aparato:
    un generador de parches (110) configurado para generar un primer parche (112) desde la primera banda de la señal de entrada (102) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche (114) desde la primera banda de la señal de entrada (102) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche
    (114) generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche (112) generado de acuerdo con el primer algoritmo de implementación de parches; y
    un combinador (120) configurado para combinar el primer parche (112), el segundo parche (114) y la primera banda de la señal de entrada (102) para obtener la señal ampliada del ancho de banda (122), donde el aparato para generar una señal de ancho de banda ampliado está configurado para ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches y de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el primer parche (112) y el segundo parche (114) o
    para escalar el primer parche (112) y el segundo parche (114), o
    para escalar solamente uno de los parches primero o segundo para obtener un parche escalado, para combinar entonces, por el combinador (120) el parche escalado y el parche no escalado de los parches primero y segundo para obtener parches combinados, y para entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada,
    para que la señal de ancho de banda ampliado (122) cumpla con un criterio de envolvente espectral.
  2. 2.
    Un aparato de acuerdo con la reivindicación 1, donde el primer algoritmo de implementación de parches es un algoritmo de implementación de parches de armonía y el generador de parche (110) está configurado para generar el primer parche (112) para que sólo las frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102) estén contenidas por el primer parche (112).
  3. 3.
    Un aparato de acuerdo con la reivindicación 1 ó 2, donde el segundo algoritmo de implementación de parches es un algoritmo remezcla y el generador de parches (110) está configurado para generar un segundo parche (114) para que el segundo parche (114) contenga frecuencias que son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102) y contenga frecuencias que no son múltiplos enteros de frecuencias de la primera banda de la señal de entrada (102).
  4. 4.
    Un aparato de acuerdo con una de las reivindicaciones 1 a 3, donde una frecuencia de corte inferior del primer parche (112) es igual a la frecuencia de corte inferior del segundo parche (114) y una frecuencia de corte superior del primer parche (112) es igual a la frecuencia de corte superior del segundo parche (114).
  5. 5.
    Un aparato de acuerdo con una de las reivindicaciones 1 a 4, que comprende un codificador de fase operado por voz (310) para generar el primer parche (112) de acuerdo con un primer algoritmo de implementación de parches.
  6. 6.
    Un aparato de acuerdo con una de las reivindicaciones 1 a 5, que comprende un recortador de amplitud (320) configurado para generar el segundo parche (114) de acuerdo con el segundo algoritmo de implementación de parches recortando la primera banda de la señal de entrada (102).
  7. 7.
    Un aparato de acuerdo con una de las reivindicaciones 1 a 6, que comprende un selector de línea espectral (410) configurado para seleccionar una pluralidad de líneas de frecuencia del segundo parche (114) para obtener un segundo parche modificado (414) donde se selecciona una línea de frecuencia, si se pierde una línea de frecuencia correspondiente al primer parche (112), donde el combinador (120) está configurado para combinar el primer parche (112), el segundo parche modificado (414) y la primera banda de la señal de entrada (102).
  8. 8.
    Un aparato de acuerdo con una de las reivindicaciones 1 a 7, que comprende un controlador de potencia (710), configurado para controlar el ajuste a escala de la señal de entrada (102) de acuerdo con el primer y segundo algoritmo de implementación de parches o configurado para controlar el ajuste a escala de el primer parche (112), el segundo parche (114), donde el controlador de potencia (710), controla el ajuste a escala teniendo en cuenta los datos de envolvente espectral contenidos en la señal de entrada (102) y teniendo en cuenta al menos un parámetro
    de control del ajuste a escala almacenado o datos de control del ajuste a escala del parche contenidos por la señal de entrada (102).
  9. 9.
    Un aparato de acuerdo con la reivindicación 8, que comprende, un primer medio de ajuste de potencia (720) configurado para ajustar a escala la señal de entrada (102) de acuerdo con el primer algoritmo de implementación de parches o para ajustar a escala el primer parche (112), y comprende un segundo medio de ajuste de potencia (730) configurado para ajustar a escala la señal de entrada (102) de acuerdo con el segundo algoritmo de implementación de parches o para ajustar a escala el segundo parche (114), donde el controlador de potencia (710) está configurado para controlar el primer medio de ajuste de potencia (720) y el segundo medio de ajuste de potencia (730).
  10. 10.
    Un aparato de acuerdo con la reivindicación 8 ó 9, que comprende un sumador de ruido (910) está configurado para generar un parche de ruido (912) basado en datos de ruido contenidos por señal de entrada, donde el sumador de armonía perdida (920), está configurado para generar un parche de armónicos ausentes (922) basado en los datos de armónicos ausentes contenidos en la señal de entrada (102), donde el controlador de potencia (710) está configurado para controlar el ajuste a escala del parche de ruido (912) y el parche de armónicos ausentes (922) teniendo en cuenta los datos de envolvente espectral, donde el combinador (120) está configurado para combinar el primer parche (112), y el segundo parche (114), la primera banda de la señal de entrada (102), el parche de ruido
    (912) y el parche de armónicos ausentes (922) para obtener la señal de ancho de banda ampliado (122), donde el controlador de potencia (710) controla el ajuste a escala del primer parche (112), el segundo parche (114), el parche de ruido (912) y el parche de armónicos ausentes (922) teniendo en cuenta los datos de envolvente espectral, para que el criterio de envolvente espectral pueda ser cumplido.
  11. 11. Un aparato (1000) para proveer una señal de ancho de banda reducido (1032) teniendo en cuenta una señal de entrada (1002) que comprende,
    un determinador de datos de envolvente espectral (1010) configurado para determinar datos de envolvente espectral (1012) teniendo en cuenta una banda de frecuencia alta de la señal de entrada (1002);
    un generador de datos de control de ajuste a escala del parche (1020) configurado para generar datos de control de ajuste a escala del parche (1022) para ajustar a escala la señal reducida de ancho de banda (1032) en un decodificador o para ajustar a escala un primer parche y un segundo parche, por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral, donde el criterio de se basa en datos de envolvente espectral (1012) donde el primer parche es generado desde una primera banda de la señal reducida de ancho de banda (1032) de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal reducida de ancho de banda (1032) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches;
    una interfaz de salida (1030) configurada para combinar una banda de frecuencia baja de la señal de entrada (1002), los datos de envolvente espectral (1012) y datos de control de ajuste a escala del parche (1022) para obtener la señal reducida de ancho de banda (1032) y configurada para proveer la señal reducida de ancho de banda (1032) para su transmisión o almacenamiento.
  12. 12. Un aparato de acuerdo con la reivindicación 11, donde el generador de datos de control de ajuste a escala del parche comprende:
    el generador de parche está configurado para generar un primer parche desde la banda de baja frecuencia de la señal de entrada (1002) de acuerdo con un primer algoritmo de implementación de parches y configurado para generar un segundo parche desde la banda de baja frecuencia de la señal de entrada (1002) de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches; y
    un comparador configurado para comparar el primer parche, el segundo parche y la banda de frecuencia alta de la señal de entrada (1002) para obtener los datos de control de ajuste a escala del parche (1022).
  13. 13.
    Un aparato de acuerdo con la reivindicación 11, que comprende una memoria para parámetros de control de ajuste a escala del parche para almacenar y proveer una pluralidad de parámetros de control de ajuste a escala del parche donde el generador de datos de control de ajuste a escala del parche (1020) está configurado para analizar la señal de entrada (1002) y configurado para generar los datos de control de ajuste a escala del parche (1022) teniendo en cuenta los parámetros de control de ajuste a escala del parche seleccionados basados en el análisis de la señal de entrada (1002).
  14. 14.
    Un procedimiento (1100) para generar una señal de ancho de banda ampliado desde una señal de entrada, donde la señal de entrada está representada, por una primera banda por datos de primera resolución que representan una primera resolución espectral de la primera banda de la señal de entrada, y para una segunda banda por datos de segunda resolución que comprenden datos de envoltura espectral y que representan una segunda resolución espectral de la segunda banda de la señal de entrada, siendo la segunda resolución menor que la primera resolución, comprendiendo el procedimiento:
    la generación (1110) de un primer parche desde la primera banda de la señal de entrada de acuerdo con un primer algoritmo de implementación de parches;
    la generación (1120) de un segundo parche desde la primera banda de la señal de entrada de acuerdo con un segundo algoritmo de implementación de parches para reconstruir la segunda banda de la eñal de entrada, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches;
    El ajuste a escala (1130) de la señal de entrada de acuerdo con el primer algoritmo de implementación de parches antes de generar el primer parche y escalar la señal de entrada (102) de acuerdo con el segundo algoritmo de implementación de parches antes de generar el segundo parche o escalar (1130) el primer parche y el segundo parche, o escalar solamente uno de entre el primero y el segundo parche para obtener un parche escalado, y combinar, mediante una etapa de combinación (114) los parches escalado y no escalado a partir de los parches primero y segundo para obtener parches combinados, y entonces escalar los parches combinados antes de combinar los parches combinados con la primera banda de la señal de entrada, para que la señal de ancho de banda ampliado cumpla con un criterio de envolvente espectral basado en los datos de envolvente espectral; y
    La combinación (1140) del primer parche, segundo parche y primera banda de la señal de entrada para obtener la señal de ancho de banda ampliado.
  15. 15. Un procedimiento (1200) para proveer una señal reducida de ancho de banda basada en una señal de entrada, que comprende:
    la determinación (1210) de datos de envolvente espectral basados en una banda de alta frecuencia de la señal de entrada;
    la generación (1220) de datos de control de ajuste a escala del parche para ajustar a escala la señal reducida de ancho de banda en un decodificador o para ajustar a escala un primer parche y segundo parche por el decodificador para que la señal de ancho de banda ampliado generada por el decodificador cumpla con un criterio de envolvente espectral, donde el criterio de envolvente espectral se basa en los datos de envolvente espectral, donde el primer parche es generado desde una primera banda de la señal reducida de ancho de banda de acuerdo con un primer algoritmo de implementación de parches y el segundo parche es generado desde la primera banda de la señal reducida de ancho de banda de acuerdo con un segundo algoritmo de implementación de parches, donde una densidad espectral del segundo parche generado de acuerdo con el segundo algoritmo de implementación de parches es mayor que la densidad espectral del primer parche generado de acuerdo con el primer algoritmo de implementación de parches.
    la combinación (1230) de la banda de baja frecuencia de la señal de entrada, datos de envolvente espectral y datos de control de ajuste a escala del parche para obtener la señal reducida de ancho de banda;
    la provisión (1240) de la señal de ancho de banda reducido para u transmisión o almacenamiento.
  16. 16. Un programa de ordenador con un código de programa para desarrollar el procedimiento de acuerdo con la reivindicación 14 ó 15, cuando el programa de ordenador se ejecuta en una computadora o micro-controlador.
ES09776840.2T 2008-07-11 2009-06-25 Aparato y procedimiento para generar una señal de ancho de banda ampliado Active ES2461141T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7984908P 2008-07-11 2008-07-11
US79849P 2008-07-11
PCT/EP2009/004603 WO2010003557A1 (en) 2008-07-11 2009-06-25 Apparatus and method for generating a bandwidth extended signal

Publications (1)

Publication Number Publication Date
ES2461141T3 true ES2461141T3 (es) 2014-05-16

Family

ID=41162740

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09776840.2T Active ES2461141T3 (es) 2008-07-11 2009-06-25 Aparato y procedimiento para generar una señal de ancho de banda ampliado

Country Status (18)

Country Link
EP (1) EP2291842B1 (es)
JP (1) JP5255699B2 (es)
KR (1) KR101239812B1 (es)
CN (1) CN102105931B (es)
AR (1) AR072483A1 (es)
AU (1) AU2009267460B2 (es)
BR (2) BRPI0910528B1 (es)
CA (1) CA2729474C (es)
CO (1) CO6541514A2 (es)
ES (1) ES2461141T3 (es)
HK (1) HK1154112A1 (es)
MX (1) MX2011000365A (es)
MY (1) MY163454A (es)
PL (1) PL2291842T3 (es)
RU (1) RU2512090C2 (es)
TW (1) TWI415116B (es)
WO (1) WO2010003557A1 (es)
ZA (1) ZA201009164B (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3564954T3 (pl) * 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9117459B2 (en) * 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
CA3220202A1 (en) * 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US8490008B2 (en) * 2011-11-10 2013-07-16 Research In Motion Limited Touchscreen keyboard predictive display and generation of a set of characters
CN104221081B (zh) * 2011-11-02 2017-03-15 瑞典爱立信有限公司 带宽扩展音频信号的高频带扩展的生成
CN102543086B (zh) * 2011-12-16 2013-08-14 大连理工大学 一种基于音频水印的语音带宽扩展的装置和方法
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2589305C1 (ru) * 2014-11-18 2016-07-10 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
EP3121814A1 (en) * 2015-07-24 2017-01-25 Sound object techology S.A. in organization A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US654988A (en) * 1900-03-16 1900-07-31 Leonhard Lederer Process of making acetyl cellulose.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
WO2003019534A1 (en) * 2001-08-31 2003-03-06 Koninklijke Philips Electronics N.V. Bandwidth extension of a sound signal
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7577259B2 (en) * 2003-05-20 2009-08-18 Panasonic Corporation Method and apparatus for extending band of audio signal using higher harmonic wave generator
JP2005010621A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び帯域拡張方法
ATE480851T1 (de) * 2004-10-28 2010-09-15 Panasonic Corp Skalierbare codierungsvorrichtung, skalierbare decodierungsvorrichtung und verfahren dafür
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体

Also Published As

Publication number Publication date
MX2011000365A (es) 2011-02-25
JP5255699B2 (ja) 2013-08-07
PL2291842T3 (pl) 2014-08-29
EP2291842B1 (en) 2014-03-12
AR072483A1 (es) 2010-09-01
CN102105931A (zh) 2011-06-22
KR20110033188A (ko) 2011-03-30
KR101239812B1 (ko) 2013-03-06
CA2729474A1 (en) 2010-01-14
BRPI0910528A2 (pt) 2018-05-22
CA2729474C (en) 2015-09-01
BR122017003818A2 (pt) 2019-09-03
BRPI0910528B1 (pt) 2020-09-24
AU2009267460B2 (en) 2013-01-10
CN102105931B (zh) 2013-04-10
RU2011100134A (ru) 2012-07-20
BR122017003818B1 (pt) 2024-03-05
CO6541514A2 (es) 2012-10-16
TWI415116B (zh) 2013-11-11
MY163454A (en) 2017-09-15
RU2512090C2 (ru) 2014-04-10
TW201007708A (en) 2010-02-16
WO2010003557A1 (en) 2010-01-14
ZA201009164B (en) 2011-10-26
AU2009267460A1 (en) 2010-01-14
JP2011527452A (ja) 2011-10-27
HK1154112A1 (en) 2012-04-20
EP2291842A1 (en) 2011-03-09

Similar Documents

Publication Publication Date Title
ES2461141T3 (es) Aparato y procedimiento para generar una señal de ancho de banda ampliado
AU2009210303B2 (en) Device and method for a bandwidth extension of an audio signal
JP6229957B2 (ja) 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号
KR101369267B1 (ko) 오디오 인코더 및 대역폭 확장 디코더
US8880410B2 (en) Apparatus and method for generating a bandwidth extended signal
JP2013525824A (ja) カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
US20230343354A1 (en) Apparatus and Method for Generating a Bandwidth Extended Signal