MX2011000361A

MX2011000361A - Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda.

Info

Publication number: MX2011000361A
Application number: MX2011000361A
Authority: MX
Inventors: Harald Popp; Max Neuendorf; Bernhard Grill; Ulrich Kraemer; Markus Multrus; Nikolaus Rettelbach; Frederik Nagel; Markus Lohwasser; Marc Gayer; Manuel Jander; Virgilio Bacigalupo
Original assignee: Ten Forschung Ev Fraunhofer
Priority date: 2008-07-11
Filing date: 2009-06-23
Publication date: 2011-02-25
Also published as: RU2011103999A; TWI415114B; TW201007700A; AU2009267530A1; KR101395252B1; CA2730200C; US8296159B2; KR101278546B1; JP5628163B2; BRPI0910523A2; CA2729971C; TWI415115B; EP2301028A2; IL210330A0; JP2011527448A; WO2010003544A1; US20110202352A1; KR101345695B1; WO2010003546A3; CN102144259A

Abstract

Un aparato (100) para generar datos de salida del ancho de banda (102) para una señal de audio (105) que comprende un medidor del piso de ruido (110), un caracterizador de energía de la señal (120) y un procesador (130). La señal de audio (105) comprende componentes en una primera banda de frecuencia (105a) y componentes en una segunda banda de frecuencia (105b), los datos de salida del ancho de banda (102) están adaptados para controlar una síntesis de los componentes en la segunda banda de frecuencia (105b). El medidor del piso de ruido (110) mide los datos del piso de ruido data (115) de la segunda banda de frecuencia (105b) para una porción de tiempo (T) de la señal de audio (105). El caracterizador de energía de la señal (120) deriva los datos de distribución de energía (125), los datos de distribución de energía (125) caracterizan una distribución de energía en un espectro de la porción de tiempo (T) de la señal de audio (105). El procesador (130) combina los datos del piso de ruido (115) y los datos de distribución de energía (125) para obtener los datos de salida del ancho de banda (102).

Description

UN APARATO Y UN MÉTODO PARA GENERAR DATOS D POR AMPLIACIÓN DE ANCHO DE BANDA cripción La presente invención se relaciona con un aparato y un rar datos de salida por ampliación de ancho de banda (BWE, po s), un codificador de audio y un decodificador de audio.

La codificación de audio y codificación de voz natural con des clases de codificaciones para las señales de audio. La co io natural se utiliza comúnmente para señales de música o señal asa de bits media y generalmente ofrece amplios anchos de ban codificadores de voz están básicamente limitados a la reprodúce den utilizarse a baja tasa de bits. Una banda ancha de voz ofre ora de calidad subjetiva en comparación con la banda estre más, debido al tremendo crecimiento del campo de la m ación de tasa de bits dada, la velocidad de muestreo se reduce, ún disminuir la cantidad de niveles de composición, permitien ional una distorsión de cuantización auditiva y emplear una deg po estéreo a través de una codificación estéreo conjunta o métrica de dos o más canales.

El uso excesivo de dichos métodos da por resultado una eptiva engorrosa. Con el fin de mejorar el desempeño de cod a la replicación de banda espectral (SBR, por su sigla en in odo eficiente para generar señales de frecuencia alta en un codific reconstrucción de frecuencia alta (HFR, por su sigla en inglés).

Al grabar y transmitir señales acústicas, un piso de ruido com o se encuentra siempre presente. Con el fin de generar una se ntica del lado del decodificador, el piso de ruido debería ser t erado. En este último caso, el piso de ruido en la señal de a ería ser determinado. En la replicación de banda espectral, esto s uaciones de energía o los llamados transitorios, a corto plazo. Est on perceptivamente aceptables y no se proporciona en técnicas ción aceptable (especialmente si el ancho de banda es limitado).

Un objetivo de la presente invención consiste, por lo tanto, e rato, que permita una eficiente codificación sin artefactos ibirse, especialmente para señales de voz.

Este objetivo se logra mediante un aparato para generar dat de acuerdo con la reivindicación 1 , el codificador de acu ndicación 7, un método para generar datos de salida SBR de ac ndicación 10, un decodificador de acuerdo con la reivindica odo para decodificación de acuerdo con la reivindicación 14 o u io codificada de acuerdo con la reivindicación 16.

La presente invención se basa en el principio que una adapt de ruido medido que depende de la distribución de energía de esión de tonalidad subjetiva para la señal de audio original dificada sea la misma, existe aún la posibilidad de artefactos ge plo para señales de voz.

Los tests subjetivos muestran que diferentes tipos de señ rían ser tratadas en forma diferente. En señales de discurso voc inución del piso de ruido calculado produce una mayor calidad pararla con el piso de ruido calculado original. En consecuencia l os reverberante en este caso. En caso que la señal de audio antes un aumento artificial de piso de ruido podrá encubrir los inc l método de implementación de parches ("patching") relacion antes. Por ejemplo, las fluctuaciones de energía a corto plazo ucen artefactos perturbadores al ser cambiadas o transformadas recuencia mayor y un aumento en el piso de ruido podrá tamb s fluctuaciones de energía.

Dichos transitorios pueden definirse como porciones dentro influencia en el mecanismo de detección de transitorios con ico.

En consecuencia, las formas de realización proveen una dis de ruido para una señal como un discurso vocalizado y un aum uido para una señal s que comprende, por ejemplo, sibilantes.

Para distinguir las diferentes señales, las formas de realiza s de distribución de energía (por ejemplo un parámetro de si si la energía se encuentra mayormente en frecuencias uencias menores, o en otras palabras, si la representación es l de audio muestra una pendiente en aumento o en dismin uencias mayores. Otras formas de realización también utiliza iciente LPC (LPC = sigla en inglés correspondiente a la traducción ictiva lineal) para generar el parámetro de sibilancia.

Existen dos posibilidades para cambiar el piso de ruido. ificados al decodificador y no se necesitan modificaciones d dificador -puede utilizarse el mismo decodificador. Por l ipulación del piso de ruido puede en principio ser realizada ficador como así también del lado del decodificador.

La replicación de banda espectral como ejemplo de ancho d en cuadros SBR que definen una porción de tiempo en la cual io está separada en componentes en la primera banda de fre nda banda de frecuencia. El piso de ruido puede medirse y/o ca el cuadro SBR. De manera alternativa, es también posible qu se divida en envolventes de ruido, para que para cada envolve realizar un ajuste para el piso de ruido. En otras palabras, l poral resolución de las herramientas del piso de ruido es determi adas envolventes de ruido dentro del cuadro SBR. De acuerdo c /IEC 14496-3), cada cuadro SBR comprende un máximo de dos uido, para que se pueda realizar un ajuste del piso de ruido tenien uadros parciales SBR. Para algunas aplicaciones, esto podría se prende un medidor de piso de ruido para medir los datos del piso gunda banda de frecuencia para una porción de tiempo de la se ÍO el piso de ruido medido ejerce influencia en la tonalidad de io, el medidor del piso de ruido puede comprender un medidor de t a alternativa, el medidor del piso de ruido puede ser implementad ido de una señal para obtener e! piso de ruido. El aparato ademá aracterizador de energía de señal para derivar los datos de di rgía, donde los datos de distribución de energía caracterizan un energía en un espectro de la porción de tiempo de la señal ímente, el aparato comprende un procesador para combinar los d uido y los datos de distribución de energía para obtener datos E.

En otras formas de realización, caracterizador de energía pta para usar el parámetro de sibilancia como datos de distribució parámetro de sibilancia puede, por ejemplo, ser el primer coefici s formas de realización, el procesador se adapta para agregar En otras formas de realización, la porción de tiempo es un cua cterizador de energía de señal se adapta para generar una lventes de piso de ruido por cuadro SBR. En consecuencia, el de ruido como el caracterizador de energía de señal pueden ad ir los datos del piso de ruido como también los datos de la dis gía derivados para cada envolvente de piso de ruido. La lvente de piso de ruido puede, por ejemplo ser 1 , 2, 4, ... por cuad Otras formas de realización comprenden además una her icación de banda espectral utilizada en un decodificador p ponentes en una segunda banda de frecuencia de la señal de au ración se utilizan datos de salida de replicación de banda esentación espectral de señal cruda para los componentes en da de frecuencia. La herramienta de replicación de band prende una unidad de cálculo del piso de ruido, configurada par de ruido de acuerdo con los datos de distribución de en binador para combinar la representación espectral de señal co l de piso de ruido. Para señales de discurso vocalizado (deri isión de conmutación externa) se realiza un análisis de discurso a rminar la vocalización de la señal real. La cantidad de ruido a a dificador o codificador es escalada dependiendo del grado trario al de vocalización) de la señal. El grado de sibilancia rminado, por ejemplo, midiendo la pendiente espectral de las al corta. ve Descripción de los Dibujos La presente invención será descripta a continuación a modo rativos. Las características de la invención serán apreciadas lidad y mejor comprensión teniendo en cuenta la siguiente liada, que debería ser considerada con referencia a los dibuj de: explica el cálculo de la pendiente espectral m basada e de parámetros LPC; ig. 3 muestra un diagrama de bloque de un codificador; ig. 4 muestra diagramas de bloque para procesar la secuen codificada para emitir muestras PCM (sigla en inglés corr a la traducción modulación por código de pulso) d decodificador; ig. 5a, b muestra una comparación de una herramienta convencional de piso de ruido con una herramienta modificada de piso de ruido de acuerdo con las realización; y ig. 6 ilustra la partición de un cuadro SBR en una cantidad pre de porciones de tiempo. esador 130. El medidor de piso de ruido 110 se adapta p rminar los datos del piso de ruido 115 de la segunda banda d para una porción de tiempo de la señal de audio 105. En detall puede ser determinado al comparar el ruido medido de la banda medido de la banda superior, para que la cantidad de ruid ués de la implementación del parche ("patch") para reproducir u onalidad natural pueda ser determinada. El caracterizador de ener deriva los datos de distribución de energía 25 caracterizando un nergía en un espectro de porción de tiempo de la señal de au , el medidor de piso de ruido 110 recibe, por ejemplo, la primera a de frecuencia 105a,b y el caracterizador de energía de señal ejemplo, la primera y/o segunda banda de frecuencia 105af b. El recibe los datos del piso de ruido 115 y los datos de distribució y los combina para obtener los datos de salida BWE 102. La re da espectral comprende un ejemplo para la ampliación de anch de los datos de salida BWE 102 se transforman en datos de sali ientes formas de realización describen principalmente el ejemplo d mplo, definirse como componentes de frecuencia sobre un valor ede estar dado, por ejemplo, por 4 kHz y la banda base (banda in r los componentes de la señal, que se encuentren debajo de este frecuencia (por ejemplo, debajo de 4 kHz u otra frecuencia). Ej e valor umbral de frecuencias serían 5 kHz o 6 kHz.

Las Figs. 2a y 2b muestran dos distribuciones de energía en tro de una porción de tiempo de la señal de audio 105. Las distri rgía mostradas por un nivel P como una función de la frecuencia loga, que puede también ser una envolvente de una señal d alidad de muestras o líneas (transformada en dominio de frec ieos mostrados están más simplificados para visualizar el diente espectral. La banda de frecuencia superior e inferior pue o frecuencias por debajo o sobre el valor umbral de frecuencia F ruce, por ejemplo 500 Hz, 1 kHz o 2 kHz), La Fig. 2a muestra una distribución de energía que exhibe u La Fig. 2b muestra el caso, donde el nivel P aumenta con las plicando una pendiente espectral positiva (una función en aument ndiendo de las frecuencias). Por lo tanto, el nivel P comprende u ctral positiva si el nivel de señal P indica que hay más energía rior (F > F0) comparado con la banda inferior (F < F0). Dicha di rgía es generada si la señal de audio 105 comprende, por ejer antes.

La Fig. 2a ilustra un espectro de potencia de una señal co ctral negativa. Una pendiente espectral negativa significa una p a espectral. En contraposición, la Fig. 2b ilustra un espectro de señal con pendiente espectral positiva. En otras palabras, est ctral posee una pendiente en ascenso. Naturalmente, cada espe ctro ilustrado en la Fig. 2a o el espectro ilustrado en la Fig. ciones en una escala local que posee inclinaciones diferentes de ctral.

La publicación "Cálculo eficiente de la pendiente espectral d metros LPC" por V. Goncharoff, E. Von Colín y R. Morris, Naval trol and Ocean Surveillance Center (NCCOSC), RDT y E División, 92152-52001 , 23 de Mayo 23, 1996 divulga varias maneras d iente espectral.

En una realización, la pendiente espectral se define como la in función lineal de cuadrados mínimos contenida dentro espectral rítmico. Sin embargo, las funciones lineales al espectro de rítmicos o al espectro de amplitud u otro tipo de espectro pueden ados. Esto es específicamente cierto en el contexto de la present e, en la forma de realización preferida, uno está principalmente i igno de la pendiente espectral, es decir, donde el result lazamiento del función lineal es positivo o negativo. El valo iente espectral, sin embargo, no radica gran importancia en la al a forma de realización de la presente invención, pero el valor re rtante en formas de realización más elaboradas. sferencia del dominio z H(z) del filtro LPC. La próxima ecuación pendiente espectral en términos de coeficientes cepstrales. Espe S la pendiente espectral, k y n son enteros y N es el mayor polo élo de todos los polos para H(z). La próxima ecuación en la Fi ctro de potencia logarítmico S(oo) del filtro LPC orden Nth. G es anancia y a? son los coeficientes de predicción lineal, y ? es ig de f es la frecuencia. La ecuación menor en la Fig. 2c directamen coeficientes cepstrales como función de los coeficientes L icientes cepstrales ck son utilizados para calcular la pendien eralmente, este método será más eficiente computacionalm orización polinomial de LPC para obtener los valores de polo, y endiente espectral utilizando ecuaciones del polo. En consecuen aber calculado los coeficientes LPC ak, uno puede calcular los strales ck utilizando la ecuación en la parte inferior de la Fig. 2c den calcular los poles pn desde los coeficientes cepstrales iera ecuación de la Fig. 2c. Luego, teniendo en cuenta los polo ular la pendiente espectral m como se define en la segunda ec ig. 2c, el signo de pendiente espectral m es inverso al signo iciente LPC ai en la definición de coeficiente LPC de la Fig. 2c.

Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, uñ n signo de la pendiente espectral de la señal de audio en una po actual de la señal de audio.

Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, d lisis LPC de una porción de tiempo de la señal de audio para e coeficientes LPC de bajo orden y derivar los datos de distribució de los coeficientes LPC de bajo orden.

Preferentemente, el caracterizador de energía de señal igurado sólo para calcular el primer coeficiente LPC y no p icientes LPC adicionales y para derivar los datos de distribución d uericias menores a frecuencias mayores, cuando el primer coe e un signo negativo.

En otras formas de realización, el detector de pendiente espectr cterizador de energía de señal 120 está configurado no sólo para icientes LPC de primer orden sino para calcular varios coeficíe orden como los coeficientes LPC hasta el orden de 3 ó 4 ó au a forma de realización, la pendiente espectral se calcula hasta dic que no sólo se puede indicar el signo como parámetro de sib bién un valor que depende de la pendiente, que posee más de o en el signo de la forma de realización.

Como se explicó previamente la sibilancia comprende una gran rgía en al región de frecuencia superior, mientras que para part a sibilancia (por ejemplo, vocales) la energía es mayormente distri a banda base (banda de frecuencia baja). Esta observación pue el fin de determinar si o hasta donde una parte de señal de voz c e el primer coeficiente LPC se puede inferir el comportamien ción de aumento o disminución). Este análisis puede realizars cterizador de energía de señal 120. En caso que el codificador para la decodificación de la señal de audio, no habrá necesidad arámetro de sibilancia, ya que el primer coeficiente LPC puede o datos de distribución de energía del lado del decodificador.

En algunas formas de realización el procesador 130 igurado para cambiar los datos del piso de ruido 115 de acuerdo c distribución de energía 125 (pendiente espectral) para ob ificados del piso de ruido, y el procesador 130 puede estar confi gar los datos modificados del piso de ruido a una secuencia prende datos de salida de BWE 102. El cambio de datos del piso de ser tal que el piso de ruido modificado aumenta para una se que comprende mayor sibilancia (Fig. 2b) en comparación con u io 105 que comprende menor sibilancia (Fig. 2a). uiador de datos de la envolvente 210. El codificador 300 co ada para muestras PCM (señal de audio 105; PCM = modulació ulso), conectada al banco de análisis QMF 320, y a los módulos BWE 310 y al filtro LP 330. El banco de análisis QMF 320 puede iltro de paso alto para separar la segunda banda de frecuenci ecta al calculador de datos de la envolvente 210, que a la vez se ormateador de secuencia de bits de carga útil 350. El filtro L prender filtro de paso bajo para separar la primera banda de fr leo 105a y se conecta con el codificador de núcleo AAC 340, qu ecta con el formateador de secuencia de bits de carga útil 350. Fi ulo relacionado con BWE 310 se conecta al calculador de olvente 210 y al codificador de núcleo AAC 340.

En consecuencia, el codificador 300 realiza un sub-muestreo d io 105 para generar componentes en la banda de frecuencia de el filtro LP 330), que son ingresados en el codificador de núcle codifica la señal de audio en la banda de frecuencia de núcleo y e stras de sub-bandas) es valuada en forma compleja y por lo tanto obre-muestreo por un factor de dos en comparación con un lar.

El módulo relacionado con BWE 310 puede por ejemplo, co rato 100 para generar datos de salida de BWE 102 y controla el C s de la envolvente 210 proporcionando, por ejemplo, datos de (parámetro de sibilancia) al calculador de datos de la env zando los componentes de audio 105b generados por el banc F 320, el calculador de datos de la envolvente 210 calcula los y envía los datos BWE 375 al formateador de secuencia de bits , que combina los datos BWE 375 con los componentes 355 codifi ificador de núcleo 340 en la secuencia de audio codificada 345. uiador de datos de la envolvente 210 puede por ejemplo usar el ancia 125 para ajustar el piso de ruidos dentro de las envolventes En forma alternativa, el aparato 100 para generar datos de de los datos BWE 375. La señal de audio codificada 355 es in plo, en un decodificador de núcleo AAC 360, que genera la se dificada 105a en la primera banda de frecuencia. La señal de ponentes en la primera banda de frecuencia) es ingresada en un nálisis de banda 32 370, que genera, por ejemplo, sub-bandas d 0532 desde la señal de audio 105a en la primera banda de fre bandas de frecuencia de la señal de audio 10532 ingresan en el g he 410 para generar una representación espectral de seña che), que ingresa en una herramienta BWE 430a. La herramienta de, por ejemplo, comprender una unidad de cálculo de piso d erar un piso de ruido. Además, la herramienta BWE 430a pued onías perdidas o realizar un paso de filtrado inverso. La herra a puede implementar métodos conocidos de replicación de band ar en la salida de datos espectrales QMF del generador de parch . El algoritmo de implementación de parches ("patching") usado e recuencia podría, por ejemplo, emplear el método de espejo copia atos espectrales dentro del dominio de frecuencia. hes ("patching") específico) y el parámetro BWE 102 comprende, bién los datos de distribución de energía 125 (por ejemplo el p ancia). La información de control 412 ingresa a la herramienta BW metros de replicación de banda espectral 102 ingresan a la herra a y a un ajustador de envolvente 430b. El ajustador de envolve rativo para ajustar la envolvente para el parche generado. En con tador de envolvente 430b genera la señal cruda ajustada 1 unda banda de frecuencia y la ingresa en un banco QMF de síntes combina los componentes de la segunda banda de frecuencia al de audio en dominio de frecuencia 10532. El banco QMF de de, por ejemplo, comprender 64 bandas de frecuencia y genera as señales (los componentes en la segunda banda de frecuen al de audio en dominio de frecuencia 10632) la señal de audio de ejemplo, salida de muestras PCM, PCM = modulación de código El banco QMF de síntesis 440 puede, por ejemplo, co binador, que combina la señal en dominio de frecuencia 10532 co eo 340 y son usados para sintetizar los componentes de la segun uencia 105b exhiben la tonalidad de la segunda banda de frecue ñal original. Especialmente en vías de discurso vocalizado, sin o adicional agregado por la herramienta convencional de piso de ar la calidad percibida de la señal reproducida.

De acuerdo con las formas de realización la herramienta del de ser modificada para que la herramienta del piso de ruido tome s de distribución de energía 125 (parte de los datos BWE 102) ÍSO de ruido según el grado de sibilancia detectado (ver Fig. rnativo, como se describe antes el decodificador no puede ificado y en cambio el codificador puede cambiar los datos del ún el grado de sibilancia detectado.

La Fig. 5 muestra una comparación de una herramienta vencional del piso de ruido con una herramienta de cálculo modifi uido de acuerdo con las formas de realización de la presente inv mitidos desde el codificador como parte de la secuencia de audi La representación espectral de señal cruda 425 se obtiene, por enerador de parche, que genera componentes de la señal de a de frecuencia superior (componentes sintetizados en la segun encia 105b). Las líneas espectrales crudas y líneas espectral n además procesadas, lo cual incluirá un filtrado inverso, lvente, adición de armonía perdida etc. Finalmente, un com bina las líneas espectrales crudas con las líneas espectral uladas a los componentes en la segunda banda de frecuencia 105 La Fig. 5b muestra una herramienta de cálculo del piso de ruido las formas de realización de la presenté invención. Además, de la álculo convencional del piso de ruido de la Fig. 5a, las formas d prenden una unidad modificadora del piso de ruido 431 confi plo, para modificar los datos transmitidos del piso de ruido bas s de distribución de energía 125 antes de ser procesados en la álculo del piso de ruido 433. Los datos de distribución de energía ejemplo una relación lineal) entre la disminución/aumento y ? ctral.

Teniendo en cuenta estos datos modificados del piso amienta de cálculo del piso de ruido 433 calcula nuevament ctrales crudas y las líneas espectrales de ruido modificado b esentación espectral de señal cruda 425, que nuevamente pued e un generador de parche. La herramienta de replicación de ban de la Fig. 5b comprende además un combinador 434 para s espectrales crudas con el piso de ruido calculado (con la e la unidad modificadora 431 ) para generar los componentes en da de frecuencia 105b.

Los datos de distribución de energía 125 pueden indicar en le una modificación en el nivel de datos transmitidos del piso de xplicó anteriormente, se puede utilizar también el primer coeficient s de distribución de energía 125. En consecuencia, si la señal d tras formas de realización los datos de distribución de energía sarse directamente en el calculador 433 modificando directamen iso de ruido como parámetro de cálculo. Por lo tanto, la unidad i piso de ruido 431 y el calculador/procesador 433 pueden combi amienta de modificadora del piso de ruido 433, 431.

En otra forma de realización la herramienta BWE 430 que c amienta de cálculo del piso comprende un conmutador, donde el configurado para conmutar entre un nivel alto para el piso de ruid ctral positiva) y un nivel bajo para el piso de ruido (pendien tiva). El nivel alto puede, por ejemplo, corresponder al caso do smitido para el ruido es duplicado (o multiplicado por un factor), ivel bajo corresponde al caso donde el nivel transmitido disminuy onmutador puede ser controlado por un bit en la secuencia de bit udio codificada 345 indicando una pendiente espectral positiva o ñal de audio. En forma alternativa el conmutador puede activarse lisis de la señal de audio decodificada 105a (componentes en la pri Aunque algunas de las Figs. 1 , 3 a 5 se ilustran como diagram os aparatos, estas figuras simultáneamente son ilustraciones de e las funcionalidades del bloque corresponden a los pasos del mé Como se explico anteriormente, una unidad de tiempo SBR (cu ión de tiempo pueden dividirse en varios bloques de dato lventes. Esta partición puede ser uniforme en todo el cuadro S tar flexibilidad a la síntesis de la señal de audio dentro del cuadro La Fig. 6 ilustra dicha partición para el cuadro SBR en una ca lventes. El cuadro SBR cubre un periodo de tiempo o porción e el tiempo inicial to y el tiempo final tn. La porción de tiemp plo, dividida en ocho porciones de tiempo, una primera porció una segunda porción de tiempo T2, una octava porción de tie ejemplo, el número máximo de envolventes coincide con el iones de tiempo y está dado por n = 8. Las 8 porciones de tiemp n separadas por 7 bordes, lo que implica que un borde 1 separa lventes de ruido cubran diferentes longitudes de tiempo. En det dos envolventes de ruido (n = 2) comprende una primera envolv nde desde el tiempo t0 por las primeras cuatro porciones de tie T4) y la segunda envolvente de ruido que cubre de la quinta ión de tiempo (T5, T6, T7 y T8). Debido a la Norma ISO/IEC idad máxima de envolventes se restringe a dos. Pero las formas d en usar cualquier cantidad de envolventes (por ejemplo dos, C lventes).

En otras formas de realización el calculador de datos de en configurado para cambiar la cantidad de envolventes dependiend os datos medidos del piso de ruido 115. Por ejemplo, si los datos de ruido 115 indican un piso de ruido variado (por ejemplo s ral) la cantidad de envolventes puede aumentar mientras en c s del piso de ruido 115 indican un ruido constante en el piso tidad de envolventes puede disminuir.

Aunque algunos aspectos han sido descriptos en el cont ato, queda claro que estos aspectos también representan una de do correspondiente, donde un bloque o dispositivo corresponde a do o rasgo de un paso del método. En forma análoga, los aspecto l contexto de un paso del método también representan una descr ue o ítem correspondiente o rasgo de un aparato correspondiente La señal de audio codificada de invención puede almacenarse lmacenamiento digital o transmitida en un medio de transmisi io de transmisión inalámbrico o por cable como la Internet.

Dependiendo de ciertos requisitos de implementación, las ización de la invención pueden implementarse en hardware o ementación puede realizarse utilizando un medio de almacena ejemplo un disquete, DVD, CD, memoria ROM, PROM, EPROM, SH, con señales de control capaces de ser leídas en forma cenados en ellos, que cooperan (o son capaces de cooperar) co Generalmente, las formas de realización de la presente inven ementarse como un producto de programa de computación con rama, el código de programa es operativo para desarrollar odos cuando el producto de programa de computación es utili putadora. El código de programa puede por ejemplo ser almac ador capaz de ser leído por una máquina.

Otras formas de realización comprenden el programa de comp arrollar uno de los métodos descriptos en la presente, almac ador capaz de ser leído por una máquina.

En otras palabras, una forma de realización del método siste, por lo tanto, en un programa de computación con un código desarrollar uno de los métodos descriptos en la presente rama de computación es utilizado en una computadora.

Otra forma de realización del método de invención consiste, po ser transferida a través de una conexión de comunicación d plo por Internet.

Otra forma de realización comprende un medio de procesa ipio una computadora, o un dispositivo lógico programable, c tado para desarrollar uno de los métodos descriptos en la presen Otra forma de realización comprende una computadora con putación instalado en la misma, para desarrollar uno de lo riptos en la presente.

En algunas formas de realización, un dispositivo lógico progr plo una matriz de puertas programables por campo) puede úti rrollar una de las funcionalidades de los métodos descriptos en lgunas formas de realización, una matriz de puertas programable e cooperar con un microprocesador con el fin de desarrollar odos descriptos en la presente. Generalmente, los m por los detalle específicos presentados a modo de descripción s formas de realización de la presente.

Claims

I 33· REIVINDICACIONES Habiendo así especialmente descripto y determinado la natu enté invención y la forma como la misma ha de ser llevada a la ara reivindicar como de propiedad y derecho exclusivo Un aparato (100) para generar datos de salida del ancho de para una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) y c en una segunda banda de frecuencia (105b), los datos de sali de banda (102) están adaptados para controlar una sínt componentes en la segunda banda de frecuencia (105b), comprende: un medidor del piso de ruido (1 10) para medir los datos del (1 15) de la segunda banda de frecuencia (105b) para una tiempo (T) de la señal de audio (105); El aparato (100) de la reivindicación 1 , donde el caracterizado de la señal (120) está configurado para utilizar, como datos de de energía (125), un parámetro de sibilancia o un parámetro d espectral, el parámetro de sibilancia o parámetro de pendiente nivel en aumento o disminución de la señal de audio (105) co (F). El aparato (100) de la reivindicación 2, donde el caracterizado de la señal (120) está configurado para utilizar la primera predictiva lineal como parámetro de sibilancia. El aparato (100) de una de las reivindicaciones precedente procesador (130) está configurado para agregar los datos del p (115) y datos de distribución de energía espectral(125) a una s bits como los datos de salida BWE (102). El aparato (100) de la reivindicación 5, donde el cambio de da de ruido (115) es tal que el piso de ruido modificado aumen señal de audio (105) que comprende mayor sibilancia en com una señal de audio (105) que comprende menor sibilancia. Un codificador (300) para codificar una señal de audio (105), audio (105) comprende componentes en una primera banda d (105a) y componentes en una segunda banda de frecuenci codificador comprende: un codificador de núcleo (340) para codificar los componentes e banda de frecuencia (105a); un aparato (100) para generar datos de salida BWE (102) de una de las reivindicaciones 1 a 6; y un calculador de datos de la envolvente (210) para calcular da para diferentes envolventes de ruido de la pluralidad de en ruido. El codificador (300) de la reivindicación 7 o reivindicació calculador de datos de la envolvente (210) está configurado p una cantidad de envolventes que dependen de un cambio medidos del piso de ruido (115). Un método para generar datos de salida del ancho de banda una señal de audio (105), la señal de audio (105) comprende c en la primera banda de frecuencia (105a) y componentes en banda de frecuencia (105b), los datos de salida del ancho de se adaptan para controlar una síntesis de los componentes e banda de frecuencia (105b), el método comprende: la medición de datos del piso de ruido (115) de la segund frecuencia (105b) para una porción de tiempo (T) de la se Una herramienta de ancho de banda (430) para generar com una segunda banda de frecuencia (105b) de una señal de basada en los datos de salida del ancho de banda (102) y b representación espectral de señal cruda (425) para los compo segunda banda de frecuencia 105b), donde los datos de salid de banda (102) comprenden datos de distribución de energí datos de distribución de energía (125) caracterizan una dis energía en un espectro de una porción de tiempo (T) de la se (105), la herramienta de ancho de banda (430) comprende: una herramienta modificadora del piso de ruido (433, 431), confi modificar un piso de ruido transmitido de acuerdo con l distribución de energía (125); y un combinador (434) para combinar la representación espect cruda (425) con el piso de ruido modificado para generar los c donde la herramienta modificadora del piso de ruido (433 adaptada para aumentar el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la segund frecuencia (105b) que en la primera banda de frecuencia para disminuir el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la primer frecuencia (105a) que la segunda banda de frecuencia (1 Un decodificador (400) para decodificar una secuencia de audi (345) para obtener una señal de audio (105) que comprende: un desformateador de secuencia de bits (357) que separ una unidad de síntesis (440) para sintetizar la señal de combinando los componentes de la primera y segunda frecuencia (105a, 105b). Un método para decodificar una secuencia de audio codificad obtener una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) dat del ancho de banda (102), donde los datos de salida del anc (102) comprenden datos de distribución de energía (125) y d de ruido, los datos de distribución de energía (125) cara distribución de energía en un espectro de una porción de tie señal de audio (105), el método comprende: la separación de la secuencia de audio codificada (345) de audio codificada (355) y los datos de salida de BWE (102); los componentes de decodificación en una primera banda d la combinación de representación espéctral de señal cruda ( piso de ruido modificado para generar los componentes en banda de frecuencia (105b) con el piso de ruido calculado; y la sintetización de la señal de audio (105) combinando los com la primera y segunda banda de frecuencia (105a, 105b). Un programa de computación para desarrollar, al ser utiliz computadora, el método de la reivindicación 10 o reivindicación 1 Una secuencia de audio codificada (345) que comprende: una señal de audio codificada (355) para componentes en una pri de frecuencia (105a) de una señal de audio (105); datos del piso de ruido adaptados para controlar una síntesis d ruido para componentes en una segunda banda de frecuencia