MX2011000361A - Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. - Google Patents
Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda.Info
- Publication number
- MX2011000361A MX2011000361A MX2011000361A MX2011000361A MX2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A
- Authority
- MX
- Mexico
- Prior art keywords
- data
- audio signal
- frequency band
- components
- noise floor
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectrometry And Color Measurement (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Control Of Amplification And Gain Control (AREA)
- Dental Tools And Instruments Or Auxiliary Dental Instruments (AREA)
- Circuit For Audible Band Transducer (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Un aparato (100) para generar datos de salida del ancho de banda (102) para una señal de audio (105) que comprende un medidor del piso de ruido (110), un caracterizador de energía de la señal (120) y un procesador (130). La señal de audio (105) comprende componentes en una primera banda de frecuencia (105a) y componentes en una segunda banda de frecuencia (105b), los datos de salida del ancho de banda (102) están adaptados para controlar una síntesis de los componentes en la segunda banda de frecuencia (105b). El medidor del piso de ruido (110) mide los datos del piso de ruido data (115) de la segunda banda de frecuencia (105b) para una porción de tiempo (T) de la señal de audio (105). El caracterizador de energía de la señal (120) deriva los datos de distribución de energía (125), los datos de distribución de energía (125) caracterizan una distribución de energía en un espectro de la porción de tiempo (T) de la señal de audio (105). El procesador (130) combina los datos del piso de ruido (115) y los datos de distribución de energía (125) para obtener los datos de salida del ancho de banda (102).
Description
UN APARATO Y UN MÉTODO PARA GENERAR DATOS D
POR AMPLIACIÓN DE ANCHO DE BANDA
cripción
La presente invención se relaciona con un aparato y un rar datos de salida por ampliación de ancho de banda (BWE, po s), un codificador de audio y un decodificador de audio.
La codificación de audio y codificación de voz natural con des clases de codificaciones para las señales de audio. La co io natural se utiliza comúnmente para señales de música o señal asa de bits media y generalmente ofrece amplios anchos de ban codificadores de voz están básicamente limitados a la reprodúce den utilizarse a baja tasa de bits. Una banda ancha de voz ofre ora de calidad subjetiva en comparación con la banda estre más, debido al tremendo crecimiento del campo de la m ación de tasa de bits dada, la velocidad de muestreo se reduce, ún disminuir la cantidad de niveles de composición, permitien ional una distorsión de cuantización auditiva y emplear una deg po estéreo a través de una codificación estéreo conjunta o métrica de dos o más canales.
El uso excesivo de dichos métodos da por resultado una eptiva engorrosa. Con el fin de mejorar el desempeño de cod a la replicación de banda espectral (SBR, por su sigla en in odo eficiente para generar señales de frecuencia alta en un codific reconstrucción de frecuencia alta (HFR, por su sigla en inglés).
Al grabar y transmitir señales acústicas, un piso de ruido com o se encuentra siempre presente. Con el fin de generar una se ntica del lado del decodificador, el piso de ruido debería ser t erado. En este último caso, el piso de ruido en la señal de a ería ser determinado. En la replicación de banda espectral, esto s uaciones de energía o los llamados transitorios, a corto plazo. Est on perceptivamente aceptables y no se proporciona en técnicas ción aceptable (especialmente si el ancho de banda es limitado).
Un objetivo de la presente invención consiste, por lo tanto, e rato, que permita una eficiente codificación sin artefactos ibirse, especialmente para señales de voz.
Este objetivo se logra mediante un aparato para generar dat de acuerdo con la reivindicación 1 , el codificador de acu ndicación 7, un método para generar datos de salida SBR de ac ndicación 10, un decodificador de acuerdo con la reivindica odo para decodificación de acuerdo con la reivindicación 14 o u io codificada de acuerdo con la reivindicación 16.
La presente invención se basa en el principio que una adapt de ruido medido que depende de la distribución de energía de esión de tonalidad subjetiva para la señal de audio original dificada sea la misma, existe aún la posibilidad de artefactos ge plo para señales de voz.
Los tests subjetivos muestran que diferentes tipos de señ rían ser tratadas en forma diferente. En señales de discurso voc inución del piso de ruido calculado produce una mayor calidad pararla con el piso de ruido calculado original. En consecuencia l os reverberante en este caso. En caso que la señal de audio antes un aumento artificial de piso de ruido podrá encubrir los inc l método de implementación de parches ("patching") relacion antes. Por ejemplo, las fluctuaciones de energía a corto plazo ucen artefactos perturbadores al ser cambiadas o transformadas recuencia mayor y un aumento en el piso de ruido podrá tamb s fluctuaciones de energía.
Dichos transitorios pueden definirse como porciones dentro influencia en el mecanismo de detección de transitorios con ico.
En consecuencia, las formas de realización proveen una dis de ruido para una señal como un discurso vocalizado y un aum uido para una señal s que comprende, por ejemplo, sibilantes.
Para distinguir las diferentes señales, las formas de realiza s de distribución de energía (por ejemplo un parámetro de si si la energía se encuentra mayormente en frecuencias uencias menores, o en otras palabras, si la representación es l de audio muestra una pendiente en aumento o en dismin uencias mayores. Otras formas de realización también utiliza iciente LPC (LPC = sigla en inglés correspondiente a la traducción ictiva lineal) para generar el parámetro de sibilancia.
Existen dos posibilidades para cambiar el piso de ruido. ificados al decodificador y no se necesitan modificaciones d dificador -puede utilizarse el mismo decodificador. Por l ipulación del piso de ruido puede en principio ser realizada ficador como así también del lado del decodificador.
La replicación de banda espectral como ejemplo de ancho d en cuadros SBR que definen una porción de tiempo en la cual io está separada en componentes en la primera banda de fre nda banda de frecuencia. El piso de ruido puede medirse y/o ca el cuadro SBR. De manera alternativa, es también posible qu se divida en envolventes de ruido, para que para cada envolve realizar un ajuste para el piso de ruido. En otras palabras, l poral resolución de las herramientas del piso de ruido es determi adas envolventes de ruido dentro del cuadro SBR. De acuerdo c /IEC 14496-3), cada cuadro SBR comprende un máximo de dos uido, para que se pueda realizar un ajuste del piso de ruido tenien uadros parciales SBR. Para algunas aplicaciones, esto podría se prende un medidor de piso de ruido para medir los datos del piso gunda banda de frecuencia para una porción de tiempo de la se ÍO el piso de ruido medido ejerce influencia en la tonalidad de io, el medidor del piso de ruido puede comprender un medidor de t a alternativa, el medidor del piso de ruido puede ser implementad ido de una señal para obtener e! piso de ruido. El aparato ademá aracterizador de energía de señal para derivar los datos de di rgía, donde los datos de distribución de energía caracterizan un energía en un espectro de la porción de tiempo de la señal ímente, el aparato comprende un procesador para combinar los d uido y los datos de distribución de energía para obtener datos E.
En otras formas de realización, caracterizador de energía pta para usar el parámetro de sibilancia como datos de distribució parámetro de sibilancia puede, por ejemplo, ser el primer coefici s formas de realización, el procesador se adapta para agregar En otras formas de realización, la porción de tiempo es un cua cterizador de energía de señal se adapta para generar una lventes de piso de ruido por cuadro SBR. En consecuencia, el de ruido como el caracterizador de energía de señal pueden ad ir los datos del piso de ruido como también los datos de la dis gía derivados para cada envolvente de piso de ruido. La lvente de piso de ruido puede, por ejemplo ser 1 , 2, 4, ... por cuad
Otras formas de realización comprenden además una her icación de banda espectral utilizada en un decodificador p ponentes en una segunda banda de frecuencia de la señal de au ración se utilizan datos de salida de replicación de banda esentación espectral de señal cruda para los componentes en da de frecuencia. La herramienta de replicación de band prende una unidad de cálculo del piso de ruido, configurada par de ruido de acuerdo con los datos de distribución de en binador para combinar la representación espectral de señal co l de piso de ruido. Para señales de discurso vocalizado (deri isión de conmutación externa) se realiza un análisis de discurso a rminar la vocalización de la señal real. La cantidad de ruido a a dificador o codificador es escalada dependiendo del grado trario al de vocalización) de la señal. El grado de sibilancia rminado, por ejemplo, midiendo la pendiente espectral de las al corta.
ve Descripción de los Dibujos
La presente invención será descripta a continuación a modo rativos. Las características de la invención serán apreciadas lidad y mejor comprensión teniendo en cuenta la siguiente liada, que debería ser considerada con referencia a los dibuj de:
explica el cálculo de la pendiente espectral m basada e de parámetros LPC;
ig. 3 muestra un diagrama de bloque de un codificador;
ig. 4 muestra diagramas de bloque para procesar la secuen codificada para emitir muestras PCM (sigla en inglés corr a la traducción modulación por código de pulso) d decodificador;
ig. 5a, b muestra una comparación de una herramienta convencional de piso de ruido con una herramienta modificada de piso de ruido de acuerdo con las realización; y
ig. 6 ilustra la partición de un cuadro SBR en una cantidad pre de porciones de tiempo.
esador 130. El medidor de piso de ruido 110 se adapta p rminar los datos del piso de ruido 115 de la segunda banda d para una porción de tiempo de la señal de audio 105. En detall puede ser determinado al comparar el ruido medido de la banda medido de la banda superior, para que la cantidad de ruid ués de la implementación del parche ("patch") para reproducir u onalidad natural pueda ser determinada. El caracterizador de ener deriva los datos de distribución de energía 25 caracterizando un nergía en un espectro de porción de tiempo de la señal de au , el medidor de piso de ruido 110 recibe, por ejemplo, la primera a de frecuencia 105a,b y el caracterizador de energía de señal ejemplo, la primera y/o segunda banda de frecuencia 105af b. El recibe los datos del piso de ruido 115 y los datos de distribució y los combina para obtener los datos de salida BWE 102. La re da espectral comprende un ejemplo para la ampliación de anch de los datos de salida BWE 102 se transforman en datos de sali ientes formas de realización describen principalmente el ejemplo d mplo, definirse como componentes de frecuencia sobre un valor ede estar dado, por ejemplo, por 4 kHz y la banda base (banda in r los componentes de la señal, que se encuentren debajo de este frecuencia (por ejemplo, debajo de 4 kHz u otra frecuencia). Ej e valor umbral de frecuencias serían 5 kHz o 6 kHz.
Las Figs. 2a y 2b muestran dos distribuciones de energía en tro de una porción de tiempo de la señal de audio 105. Las distri rgía mostradas por un nivel P como una función de la frecuencia loga, que puede también ser una envolvente de una señal d alidad de muestras o líneas (transformada en dominio de frec ieos mostrados están más simplificados para visualizar el diente espectral. La banda de frecuencia superior e inferior pue o frecuencias por debajo o sobre el valor umbral de frecuencia F ruce, por ejemplo 500 Hz, 1 kHz o 2 kHz),
La Fig. 2a muestra una distribución de energía que exhibe u La Fig. 2b muestra el caso, donde el nivel P aumenta con las plicando una pendiente espectral positiva (una función en aument ndiendo de las frecuencias). Por lo tanto, el nivel P comprende u ctral positiva si el nivel de señal P indica que hay más energía rior (F > F0) comparado con la banda inferior (F < F0). Dicha di rgía es generada si la señal de audio 105 comprende, por ejer antes.
La Fig. 2a ilustra un espectro de potencia de una señal co ctral negativa. Una pendiente espectral negativa significa una p a espectral. En contraposición, la Fig. 2b ilustra un espectro de señal con pendiente espectral positiva. En otras palabras, est ctral posee una pendiente en ascenso. Naturalmente, cada espe ctro ilustrado en la Fig. 2a o el espectro ilustrado en la Fig. ciones en una escala local que posee inclinaciones diferentes de ctral.
La publicación "Cálculo eficiente de la pendiente espectral d metros LPC" por V. Goncharoff, E. Von Colín y R. Morris, Naval trol and Ocean Surveillance Center (NCCOSC), RDT y E División, 92152-52001 , 23 de Mayo 23, 1996 divulga varias maneras d iente espectral.
En una realización, la pendiente espectral se define como la in función lineal de cuadrados mínimos contenida dentro espectral rítmico. Sin embargo, las funciones lineales al espectro de rítmicos o al espectro de amplitud u otro tipo de espectro pueden ados. Esto es específicamente cierto en el contexto de la present e, en la forma de realización preferida, uno está principalmente i igno de la pendiente espectral, es decir, donde el result lazamiento del función lineal es positivo o negativo. El valo iente espectral, sin embargo, no radica gran importancia en la al a forma de realización de la presente invención, pero el valor re rtante en formas de realización más elaboradas.
sferencia del dominio z H(z) del filtro LPC. La próxima ecuación pendiente espectral en términos de coeficientes cepstrales. Espe S la pendiente espectral, k y n son enteros y N es el mayor polo élo de todos los polos para H(z). La próxima ecuación en la Fi ctro de potencia logarítmico S(oo) del filtro LPC orden Nth. G es anancia y a? son los coeficientes de predicción lineal, y ? es ig de f es la frecuencia. La ecuación menor en la Fig. 2c directamen coeficientes cepstrales como función de los coeficientes L icientes cepstrales ck son utilizados para calcular la pendien eralmente, este método será más eficiente computacionalm orización polinomial de LPC para obtener los valores de polo, y endiente espectral utilizando ecuaciones del polo. En consecuen aber calculado los coeficientes LPC ak, uno puede calcular los strales ck utilizando la ecuación en la parte inferior de la Fig. 2c den calcular los poles pn desde los coeficientes cepstrales iera ecuación de la Fig. 2c. Luego, teniendo en cuenta los polo ular la pendiente espectral m como se define en la segunda ec ig. 2c, el signo de pendiente espectral m es inverso al signo iciente LPC ai en la definición de coeficiente LPC de la Fig. 2c.
Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, uñ n signo de la pendiente espectral de la señal de audio en una po actual de la señal de audio.
Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, d lisis LPC de una porción de tiempo de la señal de audio para e coeficientes LPC de bajo orden y derivar los datos de distribució de los coeficientes LPC de bajo orden.
Preferentemente, el caracterizador de energía de señal igurado sólo para calcular el primer coeficiente LPC y no p icientes LPC adicionales y para derivar los datos de distribución d uericias menores a frecuencias mayores, cuando el primer coe e un signo negativo.
En otras formas de realización, el detector de pendiente espectr cterizador de energía de señal 120 está configurado no sólo para icientes LPC de primer orden sino para calcular varios coeficíe orden como los coeficientes LPC hasta el orden de 3 ó 4 ó au a forma de realización, la pendiente espectral se calcula hasta dic que no sólo se puede indicar el signo como parámetro de sib bién un valor que depende de la pendiente, que posee más de o en el signo de la forma de realización.
Como se explicó previamente la sibilancia comprende una gran rgía en al región de frecuencia superior, mientras que para part a sibilancia (por ejemplo, vocales) la energía es mayormente distri a banda base (banda de frecuencia baja). Esta observación pue el fin de determinar si o hasta donde una parte de señal de voz c e el primer coeficiente LPC se puede inferir el comportamien ción de aumento o disminución). Este análisis puede realizars cterizador de energía de señal 120. En caso que el codificador para la decodificación de la señal de audio, no habrá necesidad arámetro de sibilancia, ya que el primer coeficiente LPC puede o datos de distribución de energía del lado del decodificador.
En algunas formas de realización el procesador 130 igurado para cambiar los datos del piso de ruido 115 de acuerdo c distribución de energía 125 (pendiente espectral) para ob ificados del piso de ruido, y el procesador 130 puede estar confi gar los datos modificados del piso de ruido a una secuencia prende datos de salida de BWE 102. El cambio de datos del piso de ser tal que el piso de ruido modificado aumenta para una se que comprende mayor sibilancia (Fig. 2b) en comparación con u io 105 que comprende menor sibilancia (Fig. 2a).
uiador de datos de la envolvente 210. El codificador 300 co ada para muestras PCM (señal de audio 105; PCM = modulació ulso), conectada al banco de análisis QMF 320, y a los módulos BWE 310 y al filtro LP 330. El banco de análisis QMF 320 puede iltro de paso alto para separar la segunda banda de frecuenci ecta al calculador de datos de la envolvente 210, que a la vez se ormateador de secuencia de bits de carga útil 350. El filtro L prender filtro de paso bajo para separar la primera banda de fr leo 105a y se conecta con el codificador de núcleo AAC 340, qu ecta con el formateador de secuencia de bits de carga útil 350. Fi ulo relacionado con BWE 310 se conecta al calculador de olvente 210 y al codificador de núcleo AAC 340.
En consecuencia, el codificador 300 realiza un sub-muestreo d io 105 para generar componentes en la banda de frecuencia de el filtro LP 330), que son ingresados en el codificador de núcle codifica la señal de audio en la banda de frecuencia de núcleo y e stras de sub-bandas) es valuada en forma compleja y por lo tanto obre-muestreo por un factor de dos en comparación con un lar.
El módulo relacionado con BWE 310 puede por ejemplo, co rato 100 para generar datos de salida de BWE 102 y controla el C s de la envolvente 210 proporcionando, por ejemplo, datos de (parámetro de sibilancia) al calculador de datos de la env zando los componentes de audio 105b generados por el banc F 320, el calculador de datos de la envolvente 210 calcula los y envía los datos BWE 375 al formateador de secuencia de bits , que combina los datos BWE 375 con los componentes 355 codifi ificador de núcleo 340 en la secuencia de audio codificada 345. uiador de datos de la envolvente 210 puede por ejemplo usar el ancia 125 para ajustar el piso de ruidos dentro de las envolventes
En forma alternativa, el aparato 100 para generar datos de de los datos BWE 375. La señal de audio codificada 355 es in plo, en un decodificador de núcleo AAC 360, que genera la se dificada 105a en la primera banda de frecuencia. La señal de ponentes en la primera banda de frecuencia) es ingresada en un nálisis de banda 32 370, que genera, por ejemplo, sub-bandas d 0532 desde la señal de audio 105a en la primera banda de fre bandas de frecuencia de la señal de audio 10532 ingresan en el g he 410 para generar una representación espectral de seña che), que ingresa en una herramienta BWE 430a. La herramienta de, por ejemplo, comprender una unidad de cálculo de piso d erar un piso de ruido. Además, la herramienta BWE 430a pued onías perdidas o realizar un paso de filtrado inverso. La herra a puede implementar métodos conocidos de replicación de band ar en la salida de datos espectrales QMF del generador de parch . El algoritmo de implementación de parches ("patching") usado e recuencia podría, por ejemplo, emplear el método de espejo copia atos espectrales dentro del dominio de frecuencia.
hes ("patching") específico) y el parámetro BWE 102 comprende, bién los datos de distribución de energía 125 (por ejemplo el p ancia). La información de control 412 ingresa a la herramienta BW metros de replicación de banda espectral 102 ingresan a la herra a y a un ajustador de envolvente 430b. El ajustador de envolve rativo para ajustar la envolvente para el parche generado. En con tador de envolvente 430b genera la señal cruda ajustada 1 unda banda de frecuencia y la ingresa en un banco QMF de síntes combina los componentes de la segunda banda de frecuencia al de audio en dominio de frecuencia 10532. El banco QMF de de, por ejemplo, comprender 64 bandas de frecuencia y genera as señales (los componentes en la segunda banda de frecuen al de audio en dominio de frecuencia 10632) la señal de audio de ejemplo, salida de muestras PCM, PCM = modulación de código
El banco QMF de síntesis 440 puede, por ejemplo, co binador, que combina la señal en dominio de frecuencia 10532 co eo 340 y son usados para sintetizar los componentes de la segun uencia 105b exhiben la tonalidad de la segunda banda de frecue ñal original. Especialmente en vías de discurso vocalizado, sin o adicional agregado por la herramienta convencional de piso de ar la calidad percibida de la señal reproducida.
De acuerdo con las formas de realización la herramienta del de ser modificada para que la herramienta del piso de ruido tome s de distribución de energía 125 (parte de los datos BWE 102) ÍSO de ruido según el grado de sibilancia detectado (ver Fig. rnativo, como se describe antes el decodificador no puede ificado y en cambio el codificador puede cambiar los datos del ún el grado de sibilancia detectado.
La Fig. 5 muestra una comparación de una herramienta vencional del piso de ruido con una herramienta de cálculo modifi uido de acuerdo con las formas de realización de la presente inv mitidos desde el codificador como parte de la secuencia de audi La representación espectral de señal cruda 425 se obtiene, por enerador de parche, que genera componentes de la señal de a de frecuencia superior (componentes sintetizados en la segun encia 105b). Las líneas espectrales crudas y líneas espectral n además procesadas, lo cual incluirá un filtrado inverso, lvente, adición de armonía perdida etc. Finalmente, un com bina las líneas espectrales crudas con las líneas espectral uladas a los componentes en la segunda banda de frecuencia 105
La Fig. 5b muestra una herramienta de cálculo del piso de ruido las formas de realización de la presenté invención. Además, de la álculo convencional del piso de ruido de la Fig. 5a, las formas d prenden una unidad modificadora del piso de ruido 431 confi plo, para modificar los datos transmitidos del piso de ruido bas s de distribución de energía 125 antes de ser procesados en la álculo del piso de ruido 433. Los datos de distribución de energía ejemplo una relación lineal) entre la disminución/aumento y ? ctral.
Teniendo en cuenta estos datos modificados del piso amienta de cálculo del piso de ruido 433 calcula nuevament ctrales crudas y las líneas espectrales de ruido modificado b esentación espectral de señal cruda 425, que nuevamente pued e un generador de parche. La herramienta de replicación de ban de la Fig. 5b comprende además un combinador 434 para s espectrales crudas con el piso de ruido calculado (con la e la unidad modificadora 431 ) para generar los componentes en da de frecuencia 105b.
Los datos de distribución de energía 125 pueden indicar en le una modificación en el nivel de datos transmitidos del piso de xplicó anteriormente, se puede utilizar también el primer coeficient s de distribución de energía 125. En consecuencia, si la señal d tras formas de realización los datos de distribución de energía sarse directamente en el calculador 433 modificando directamen iso de ruido como parámetro de cálculo. Por lo tanto, la unidad i piso de ruido 431 y el calculador/procesador 433 pueden combi amienta de modificadora del piso de ruido 433, 431.
En otra forma de realización la herramienta BWE 430 que c amienta de cálculo del piso comprende un conmutador, donde el configurado para conmutar entre un nivel alto para el piso de ruid ctral positiva) y un nivel bajo para el piso de ruido (pendien tiva). El nivel alto puede, por ejemplo, corresponder al caso do smitido para el ruido es duplicado (o multiplicado por un factor), ivel bajo corresponde al caso donde el nivel transmitido disminuy onmutador puede ser controlado por un bit en la secuencia de bit udio codificada 345 indicando una pendiente espectral positiva o ñal de audio. En forma alternativa el conmutador puede activarse lisis de la señal de audio decodificada 105a (componentes en la pri Aunque algunas de las Figs. 1 , 3 a 5 se ilustran como diagram os aparatos, estas figuras simultáneamente son ilustraciones de e las funcionalidades del bloque corresponden a los pasos del mé
Como se explico anteriormente, una unidad de tiempo SBR (cu ión de tiempo pueden dividirse en varios bloques de dato lventes. Esta partición puede ser uniforme en todo el cuadro S tar flexibilidad a la síntesis de la señal de audio dentro del cuadro
La Fig. 6 ilustra dicha partición para el cuadro SBR en una ca lventes. El cuadro SBR cubre un periodo de tiempo o porción e el tiempo inicial to y el tiempo final tn. La porción de tiemp plo, dividida en ocho porciones de tiempo, una primera porció una segunda porción de tiempo T2, una octava porción de tie ejemplo, el número máximo de envolventes coincide con el iones de tiempo y está dado por n = 8. Las 8 porciones de tiemp n separadas por 7 bordes, lo que implica que un borde 1 separa lventes de ruido cubran diferentes longitudes de tiempo. En det dos envolventes de ruido (n = 2) comprende una primera envolv nde desde el tiempo t0 por las primeras cuatro porciones de tie T4) y la segunda envolvente de ruido que cubre de la quinta ión de tiempo (T5, T6, T7 y T8). Debido a la Norma ISO/IEC idad máxima de envolventes se restringe a dos. Pero las formas d en usar cualquier cantidad de envolventes (por ejemplo dos, C lventes).
En otras formas de realización el calculador de datos de en configurado para cambiar la cantidad de envolventes dependiend os datos medidos del piso de ruido 115. Por ejemplo, si los datos de ruido 115 indican un piso de ruido variado (por ejemplo s ral) la cantidad de envolventes puede aumentar mientras en c s del piso de ruido 115 indican un ruido constante en el piso tidad de envolventes puede disminuir.
Aunque algunos aspectos han sido descriptos en el cont ato, queda claro que estos aspectos también representan una de do correspondiente, donde un bloque o dispositivo corresponde a do o rasgo de un paso del método. En forma análoga, los aspecto l contexto de un paso del método también representan una descr ue o ítem correspondiente o rasgo de un aparato correspondiente
La señal de audio codificada de invención puede almacenarse lmacenamiento digital o transmitida en un medio de transmisi io de transmisión inalámbrico o por cable como la Internet.
Dependiendo de ciertos requisitos de implementación, las ización de la invención pueden implementarse en hardware o ementación puede realizarse utilizando un medio de almacena ejemplo un disquete, DVD, CD, memoria ROM, PROM, EPROM, SH, con señales de control capaces de ser leídas en forma cenados en ellos, que cooperan (o son capaces de cooperar) co Generalmente, las formas de realización de la presente inven ementarse como un producto de programa de computación con rama, el código de programa es operativo para desarrollar odos cuando el producto de programa de computación es utili putadora. El código de programa puede por ejemplo ser almac ador capaz de ser leído por una máquina.
Otras formas de realización comprenden el programa de comp arrollar uno de los métodos descriptos en la presente, almac ador capaz de ser leído por una máquina.
En otras palabras, una forma de realización del método siste, por lo tanto, en un programa de computación con un código desarrollar uno de los métodos descriptos en la presente rama de computación es utilizado en una computadora.
Otra forma de realización del método de invención consiste, po ser transferida a través de una conexión de comunicación d plo por Internet.
Otra forma de realización comprende un medio de procesa ipio una computadora, o un dispositivo lógico programable, c tado para desarrollar uno de los métodos descriptos en la presen
Otra forma de realización comprende una computadora con putación instalado en la misma, para desarrollar uno de lo riptos en la presente.
En algunas formas de realización, un dispositivo lógico progr plo una matriz de puertas programables por campo) puede úti rrollar una de las funcionalidades de los métodos descriptos en lgunas formas de realización, una matriz de puertas programable e cooperar con un microprocesador con el fin de desarrollar odos descriptos en la presente. Generalmente, los m por los detalle específicos presentados a modo de descripción
s formas de realización de la presente.
Claims (1)
- I 33· REIVINDICACIONES Habiendo así especialmente descripto y determinado la natu enté invención y la forma como la misma ha de ser llevada a la ara reivindicar como de propiedad y derecho exclusivo Un aparato (100) para generar datos de salida del ancho de para una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) y c en una segunda banda de frecuencia (105b), los datos de sali de banda (102) están adaptados para controlar una sínt componentes en la segunda banda de frecuencia (105b), comprende: un medidor del piso de ruido (1 10) para medir los datos del (1 15) de la segunda banda de frecuencia (105b) para una tiempo (T) de la señal de audio (105); El aparato (100) de la reivindicación 1 , donde el caracterizado de la señal (120) está configurado para utilizar, como datos de de energía (125), un parámetro de sibilancia o un parámetro d espectral, el parámetro de sibilancia o parámetro de pendiente nivel en aumento o disminución de la señal de audio (105) co (F). El aparato (100) de la reivindicación 2, donde el caracterizado de la señal (120) está configurado para utilizar la primera predictiva lineal como parámetro de sibilancia. El aparato (100) de una de las reivindicaciones precedente procesador (130) está configurado para agregar los datos del p (115) y datos de distribución de energía espectral(125) a una s bits como los datos de salida BWE (102). El aparato (100) de la reivindicación 5, donde el cambio de da de ruido (115) es tal que el piso de ruido modificado aumen señal de audio (105) que comprende mayor sibilancia en com una señal de audio (105) que comprende menor sibilancia. Un codificador (300) para codificar una señal de audio (105), audio (105) comprende componentes en una primera banda d (105a) y componentes en una segunda banda de frecuenci codificador comprende: un codificador de núcleo (340) para codificar los componentes e banda de frecuencia (105a); un aparato (100) para generar datos de salida BWE (102) de una de las reivindicaciones 1 a 6; y un calculador de datos de la envolvente (210) para calcular da para diferentes envolventes de ruido de la pluralidad de en ruido. El codificador (300) de la reivindicación 7 o reivindicació calculador de datos de la envolvente (210) está configurado p una cantidad de envolventes que dependen de un cambio medidos del piso de ruido (115). Un método para generar datos de salida del ancho de banda una señal de audio (105), la señal de audio (105) comprende c en la primera banda de frecuencia (105a) y componentes en banda de frecuencia (105b), los datos de salida del ancho de se adaptan para controlar una síntesis de los componentes e banda de frecuencia (105b), el método comprende: la medición de datos del piso de ruido (115) de la segund frecuencia (105b) para una porción de tiempo (T) de la se Una herramienta de ancho de banda (430) para generar com una segunda banda de frecuencia (105b) de una señal de basada en los datos de salida del ancho de banda (102) y b representación espectral de señal cruda (425) para los compo segunda banda de frecuencia 105b), donde los datos de salid de banda (102) comprenden datos de distribución de energí datos de distribución de energía (125) caracterizan una dis energía en un espectro de una porción de tiempo (T) de la se (105), la herramienta de ancho de banda (430) comprende: una herramienta modificadora del piso de ruido (433, 431), confi modificar un piso de ruido transmitido de acuerdo con l distribución de energía (125); y un combinador (434) para combinar la representación espect cruda (425) con el piso de ruido modificado para generar los c donde la herramienta modificadora del piso de ruido (433 adaptada para aumentar el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la segund frecuencia (105b) que en la primera banda de frecuencia para disminuir el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la primer frecuencia (105a) que la segunda banda de frecuencia (1 Un decodificador (400) para decodificar una secuencia de audi (345) para obtener una señal de audio (105) que comprende: un desformateador de secuencia de bits (357) que separ una unidad de síntesis (440) para sintetizar la señal de combinando los componentes de la primera y segunda frecuencia (105a, 105b). Un método para decodificar una secuencia de audio codificad obtener una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) dat del ancho de banda (102), donde los datos de salida del anc (102) comprenden datos de distribución de energía (125) y d de ruido, los datos de distribución de energía (125) cara distribución de energía en un espectro de una porción de tie señal de audio (105), el método comprende: la separación de la secuencia de audio codificada (345) de audio codificada (355) y los datos de salida de BWE (102); los componentes de decodificación en una primera banda d la combinación de representación espéctral de señal cruda ( piso de ruido modificado para generar los componentes en banda de frecuencia (105b) con el piso de ruido calculado; y la sintetización de la señal de audio (105) combinando los com la primera y segunda banda de frecuencia (105a, 105b). Un programa de computación para desarrollar, al ser utiliz computadora, el método de la reivindicación 10 o reivindicación 1 Una secuencia de audio codificada (345) que comprende: una señal de audio codificada (355) para componentes en una pri de frecuencia (105a) de una señal de audio (105); datos del piso de ruido adaptados para controlar una síntesis d ruido para componentes en una segunda banda de frecuencia
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7984108P | 2008-07-11 | 2008-07-11 | |
PCT/EP2009/004521 WO2010003544A1 (en) | 2008-07-11 | 2009-06-23 | An apparatus and a method for generating bandwidth extension output data |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2011000361A true MX2011000361A (es) | 2011-02-25 |
Family
ID=40902067
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2011000361A MX2011000361A (es) | 2008-07-11 | 2009-06-23 | Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. |
MX2011000367A MX2011000367A (es) | 2008-07-11 | 2009-06-23 | Un aparato y un metodo para calcular una cantidad de envolventes espectrales. |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2011000367A MX2011000367A (es) | 2008-07-11 | 2009-06-23 | Un aparato y un metodo para calcular una cantidad de envolventes espectrales. |
Country Status (20)
Country | Link |
---|---|
US (2) | US8296159B2 (es) |
EP (2) | EP2301027B1 (es) |
JP (2) | JP5628163B2 (es) |
KR (5) | KR101395257B1 (es) |
CN (2) | CN102144259B (es) |
AR (3) | AR072480A1 (es) |
AU (2) | AU2009267530A1 (es) |
BR (2) | BRPI0910523B1 (es) |
CA (2) | CA2730200C (es) |
CO (2) | CO6341676A2 (es) |
ES (2) | ES2398627T3 (es) |
HK (2) | HK1156141A1 (es) |
IL (2) | IL210196A (es) |
MX (2) | MX2011000361A (es) |
MY (2) | MY155538A (es) |
PL (2) | PL2301028T3 (es) |
RU (2) | RU2494477C2 (es) |
TW (2) | TWI415114B (es) |
WO (2) | WO2010003546A2 (es) |
ZA (2) | ZA201009207B (es) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
ES2655085T3 (es) | 2010-03-09 | 2018-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Respuesta de magnitud y alineamiento temporal mejorado en la extensión de ancho de banda basado en un vocodificador de fase para señales de audio |
CN103038819B (zh) | 2010-03-09 | 2015-02-18 | 弗兰霍菲尔运输应用研究公司 | 用以使用补丁边界对准处理输入音频信号的装置及方法 |
WO2011110496A1 (en) | 2010-03-09 | 2011-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch |
CN102971788B (zh) * | 2010-04-13 | 2017-05-31 | 弗劳恩霍夫应用研究促进协会 | 音频信号的样本精确表示的方法及编码器和解码器 |
CN102947882B (zh) * | 2010-04-16 | 2015-06-17 | 弗劳恩霍夫应用研究促进协会 | 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法 |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5633431B2 (ja) * | 2011-03-02 | 2014-12-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
WO2012158333A1 (en) | 2011-05-19 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
CN103959376B (zh) * | 2011-12-06 | 2019-04-23 | 英特尔公司 | 低功率语音检测 |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
JPWO2014034697A1 (ja) * | 2012-08-29 | 2016-08-08 | 日本電信電話株式会社 | 復号方法、復号装置、プログラム、及びその記録媒体 |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
EP2717263B1 (en) * | 2012-10-05 | 2016-11-02 | Nokia Technologies Oy | Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal |
ES2790733T3 (es) * | 2013-01-29 | 2020-10-29 | Fraunhofer Ges Forschung | Codificadores de audio, decodificadores de audio, sistemas, métodos y programas informáticos que utilizan una resolución temporal aumentada en la proximidad temporal de inicios o finales de fricativos o africados |
RU2608447C1 (ru) * | 2013-01-29 | 2017-01-18 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов |
MY180912A (en) | 2013-01-29 | 2020-12-11 | Fraunhofer Ges Forschung | Noise filling without side information for celp-like coders |
CN105247613B (zh) | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
CN110265047B (zh) | 2013-04-05 | 2021-05-18 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
ES2635026T3 (es) | 2013-06-10 | 2017-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución |
RU2662921C2 (ru) | 2013-06-10 | 2018-07-31 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения |
ES2697474T3 (es) * | 2013-06-21 | 2019-01-24 | Fraunhofer Ges Forschung | Decodificador de audio que tiene un módulo de extensión de ancho de banda con un módulo de ajuste de energía |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US9747909B2 (en) * | 2013-07-29 | 2017-08-29 | Dolby Laboratories Licensing Corporation | System and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
ES2742420T3 (es) * | 2013-12-02 | 2020-02-14 | Huawei Tech Co Ltd | Método y aparato de codificación |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
US10120067B2 (en) | 2014-08-29 | 2018-11-06 | Leica Geosystems Ag | Range data compression |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
PT3405951T (pt) * | 2016-01-22 | 2020-02-05 | Fraunhofer Ges Forschung | Aparelhos e métodos para codificar ou descodificar um sinal de áudio multicanal utilizando sincronização de controlo de quadro |
CN105513601A (zh) * | 2016-01-27 | 2016-04-20 | 武汉大学 | 一种音频编码带宽扩展中频带复制的方法及装置 |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US10084493B1 (en) * | 2017-07-06 | 2018-09-25 | Gogo Llc | Systems and methods for facilitating predictive noise mitigation |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
US11811686B2 (en) | 2020-12-08 | 2023-11-07 | Mediatek Inc. | Packet reordering method of sound bar |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
RU2256293C2 (ru) * | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Усовершенствование исходного кодирования с использованием дублирования спектральной полосы |
RU2128396C1 (ru) * | 1997-07-25 | 1999-03-27 | Гриценко Владимир Васильевич | Способ передачи и приема информации и устройство для его осуществления |
ES2247741T3 (es) * | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US7941313B2 (en) * | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
AU2002352182A1 (en) | 2001-11-29 | 2003-06-10 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
KR100711280B1 (ko) | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
JP2004350077A (ja) * | 2003-05-23 | 2004-12-09 | Matsushita Electric Ind Co Ltd | アナログオーディオ信号送信装置および受信装置並びにアナログオーディオ信号伝送方法 |
SE0301901L (sv) | 2003-06-26 | 2004-12-27 | Abb Research Ltd | Metod för att diagnostisera utrustningsstatus |
JP4767687B2 (ja) * | 2003-10-07 | 2011-09-07 | パナソニック株式会社 | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
KR101008022B1 (ko) * | 2004-02-10 | 2011-01-14 | 삼성전자주식회사 | 유성음 및 무성음 검출방법 및 장치 |
US20080260048A1 (en) | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
WO2006000110A1 (en) | 2004-06-28 | 2006-01-05 | Abb Research Ltd | System and method for suppressing redundant alarms |
DE602004020765D1 (de) | 2004-09-17 | 2009-06-04 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten Tonsignalen |
US7676043B1 (en) | 2005-02-28 | 2010-03-09 | Texas Instruments Incorporated | Audio bandwidth expansion |
KR100803205B1 (ko) | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US8396717B2 (en) | 2005-09-30 | 2013-03-12 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
KR100647336B1 (ko) | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
EP1989706B1 (fr) | 2006-02-14 | 2011-10-26 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
EP1852849A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
US20070282803A1 (en) * | 2006-06-02 | 2007-12-06 | International Business Machines Corporation | Methods and systems for inventory policy generation using structured query language |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
JP2010503881A (ja) | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8639500B2 (en) | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP5618826B2 (ja) * | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
WO2009081315A1 (en) | 2007-12-18 | 2009-07-02 | Koninklijke Philips Electronics N.V. | Encoding and decoding audio or speech |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
AU2009220321B2 (en) | 2008-03-03 | 2011-09-22 | Intellectual Discovery Co., Ltd. | Method and apparatus for processing audio signal |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
-
2009
- 2009-06-23 MY MYPI2011000037A patent/MY155538A/en unknown
- 2009-06-23 MY MYPI2011000063A patent/MY153594A/en unknown
- 2009-06-23 BR BRPI0910523-9A patent/BRPI0910523B1/pt active IP Right Grant
- 2009-06-23 KR KR1020137018760A patent/KR101395257B1/ko active IP Right Grant
- 2009-06-23 PL PL09776811T patent/PL2301028T3/pl unknown
- 2009-06-23 RU RU2011103999/08A patent/RU2494477C2/ru active
- 2009-06-23 CA CA2730200A patent/CA2730200C/en active Active
- 2009-06-23 ES ES09776811T patent/ES2398627T3/es active Active
- 2009-06-23 KR KR1020137007019A patent/KR101345695B1/ko active IP Right Grant
- 2009-06-23 ES ES09776809.7T patent/ES2539304T3/es active Active
- 2009-06-23 JP JP2011516986A patent/JP5628163B2/ja active Active
- 2009-06-23 MX MX2011000361A patent/MX2011000361A/es active IP Right Grant
- 2009-06-23 KR KR1020117000542A patent/KR101395250B1/ko active IP Right Grant
- 2009-06-23 EP EP09776809.7A patent/EP2301027B1/en active Active
- 2009-06-23 EP EP09776811A patent/EP2301028B1/en active Active
- 2009-06-23 PL PL09776809T patent/PL2301027T3/pl unknown
- 2009-06-23 CA CA2729971A patent/CA2729971C/en active Active
- 2009-06-23 AU AU2009267530A patent/AU2009267530A1/en not_active Abandoned
- 2009-06-23 KR KR1020117000543A patent/KR101278546B1/ko active IP Right Grant
- 2009-06-23 MX MX2011000367A patent/MX2011000367A/es active IP Right Grant
- 2009-06-23 CN CN200980134905.5A patent/CN102144259B/zh active Active
- 2009-06-23 CN CN2009801271169A patent/CN102089817B/zh active Active
- 2009-06-23 AU AU2009267532A patent/AU2009267532B2/en active Active
- 2009-06-23 KR KR1020137018759A patent/KR101395252B1/ko active IP Right Grant
- 2009-06-23 WO PCT/EP2009/004523 patent/WO2010003546A2/en active Application Filing
- 2009-06-23 JP JP2011516988A patent/JP5551694B2/ja active Active
- 2009-06-23 BR BRPI0910517-4A patent/BRPI0910517B1/pt active IP Right Grant
- 2009-06-23 RU RU2011101617/08A patent/RU2487428C2/ru active
- 2009-06-23 WO PCT/EP2009/004521 patent/WO2010003544A1/en active Application Filing
- 2009-07-02 TW TW098122397A patent/TWI415114B/zh active
- 2009-07-02 TW TW098122396A patent/TWI415115B/zh active
- 2009-07-07 AR ARP090102546A patent/AR072480A1/es active IP Right Grant
- 2009-07-07 AR ARP090102548A patent/AR072552A1/es unknown
-
2010
- 2010-12-22 ZA ZA2010/09207A patent/ZA201009207B/en unknown
- 2010-12-23 IL IL210196A patent/IL210196A/en active IP Right Grant
- 2010-12-29 IL IL210330A patent/IL210330A0/en active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00086A patent/ZA201100086B/en unknown
- 2011-01-06 CO CO11001332A patent/CO6341676A2/es not_active Application Discontinuation
- 2011-01-11 US US13/004,255 patent/US8296159B2/en active Active
- 2011-01-11 US US13/004,264 patent/US8612214B2/en active Active
- 2011-01-27 CO CO11009136A patent/CO6341677A2/es not_active Application Discontinuation
- 2011-09-28 HK HK11110215.5A patent/HK1156141A1/xx unknown
- 2011-09-28 HK HK11110214.6A patent/HK1156140A1/xx unknown
-
2014
- 2014-08-27 AR ARP140103215A patent/AR097473A2/es active IP Right Grant
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MX2011000361A (es) | Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. | |
KR101120911B1 (ko) | 음성신호 복호화 장치 및 음성신호 부호화 장치 | |
KR101373004B1 (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
EP2235719B1 (en) | Audio encoder and decoder | |
EP2950308B1 (en) | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method | |
KR102055022B1 (ko) | 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 | |
US10255928B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
JP2009244886A (ja) | 情報源符号化システムの性能向上装置 | |
JP2004053940A (ja) | オーディオ復号化装置およびオーディオ復号化方法 | |
WO2013062201A1 (ko) | 음성 신호의 대역 선택적 양자화 방법 및 장치 | |
JP4354561B2 (ja) | オーディオ信号符号化装置及び復号化装置 | |
AU2013257391B2 (en) | An apparatus and a method for generating bandwidth extension output data | |
Farrugia | Combined speech and audio coding with bit rate and bandwidth scalability | |
Bayer | Mixing perceptual coded audio streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |