MX2011000361A - Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. - Google Patents

Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda.

Info

Publication number
MX2011000361A
MX2011000361A MX2011000361A MX2011000361A MX2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A MX 2011000361 A MX2011000361 A MX 2011000361A
Authority
MX
Mexico
Prior art keywords
data
audio signal
frequency band
components
noise floor
Prior art date
Application number
MX2011000361A
Other languages
English (en)
Inventor
Harald Popp
Max Neuendorf
Bernhard Grill
Ulrich Kraemer
Markus Multrus
Nikolaus Rettelbach
Frederik Nagel
Markus Lohwasser
Marc Gayer
Manuel Jander
Virgilio Bacigalupo
Original Assignee
Ten Forschung Ev Fraunhofer
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ten Forschung Ev Fraunhofer filed Critical Ten Forschung Ev Fraunhofer
Publication of MX2011000361A publication Critical patent/MX2011000361A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Dental Tools And Instruments Or Auxiliary Dental Instruments (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un aparato (100) para generar datos de salida del ancho de banda (102) para una señal de audio (105) que comprende un medidor del piso de ruido (110), un caracterizador de energía de la señal (120) y un procesador (130). La señal de audio (105) comprende componentes en una primera banda de frecuencia (105a) y componentes en una segunda banda de frecuencia (105b), los datos de salida del ancho de banda (102) están adaptados para controlar una síntesis de los componentes en la segunda banda de frecuencia (105b). El medidor del piso de ruido (110) mide los datos del piso de ruido data (115) de la segunda banda de frecuencia (105b) para una porción de tiempo (T) de la señal de audio (105). El caracterizador de energía de la señal (120) deriva los datos de distribución de energía (125), los datos de distribución de energía (125) caracterizan una distribución de energía en un espectro de la porción de tiempo (T) de la señal de audio (105). El procesador (130) combina los datos del piso de ruido (115) y los datos de distribución de energía (125) para obtener los datos de salida del ancho de banda (102).

Description

UN APARATO Y UN MÉTODO PARA GENERAR DATOS D POR AMPLIACIÓN DE ANCHO DE BANDA cripción La presente invención se relaciona con un aparato y un rar datos de salida por ampliación de ancho de banda (BWE, po s), un codificador de audio y un decodificador de audio.
La codificación de audio y codificación de voz natural con des clases de codificaciones para las señales de audio. La co io natural se utiliza comúnmente para señales de música o señal asa de bits media y generalmente ofrece amplios anchos de ban codificadores de voz están básicamente limitados a la reprodúce den utilizarse a baja tasa de bits. Una banda ancha de voz ofre ora de calidad subjetiva en comparación con la banda estre más, debido al tremendo crecimiento del campo de la m ación de tasa de bits dada, la velocidad de muestreo se reduce, ún disminuir la cantidad de niveles de composición, permitien ional una distorsión de cuantización auditiva y emplear una deg po estéreo a través de una codificación estéreo conjunta o métrica de dos o más canales.
El uso excesivo de dichos métodos da por resultado una eptiva engorrosa. Con el fin de mejorar el desempeño de cod a la replicación de banda espectral (SBR, por su sigla en in odo eficiente para generar señales de frecuencia alta en un codific reconstrucción de frecuencia alta (HFR, por su sigla en inglés).
Al grabar y transmitir señales acústicas, un piso de ruido com o se encuentra siempre presente. Con el fin de generar una se ntica del lado del decodificador, el piso de ruido debería ser t erado. En este último caso, el piso de ruido en la señal de a ería ser determinado. En la replicación de banda espectral, esto s uaciones de energía o los llamados transitorios, a corto plazo. Est on perceptivamente aceptables y no se proporciona en técnicas ción aceptable (especialmente si el ancho de banda es limitado).
Un objetivo de la presente invención consiste, por lo tanto, e rato, que permita una eficiente codificación sin artefactos ibirse, especialmente para señales de voz.
Este objetivo se logra mediante un aparato para generar dat de acuerdo con la reivindicación 1 , el codificador de acu ndicación 7, un método para generar datos de salida SBR de ac ndicación 10, un decodificador de acuerdo con la reivindica odo para decodificación de acuerdo con la reivindicación 14 o u io codificada de acuerdo con la reivindicación 16.
La presente invención se basa en el principio que una adapt de ruido medido que depende de la distribución de energía de esión de tonalidad subjetiva para la señal de audio original dificada sea la misma, existe aún la posibilidad de artefactos ge plo para señales de voz.
Los tests subjetivos muestran que diferentes tipos de señ rían ser tratadas en forma diferente. En señales de discurso voc inución del piso de ruido calculado produce una mayor calidad pararla con el piso de ruido calculado original. En consecuencia l os reverberante en este caso. En caso que la señal de audio antes un aumento artificial de piso de ruido podrá encubrir los inc l método de implementación de parches ("patching") relacion antes. Por ejemplo, las fluctuaciones de energía a corto plazo ucen artefactos perturbadores al ser cambiadas o transformadas recuencia mayor y un aumento en el piso de ruido podrá tamb s fluctuaciones de energía.
Dichos transitorios pueden definirse como porciones dentro influencia en el mecanismo de detección de transitorios con ico.
En consecuencia, las formas de realización proveen una dis de ruido para una señal como un discurso vocalizado y un aum uido para una señal s que comprende, por ejemplo, sibilantes.
Para distinguir las diferentes señales, las formas de realiza s de distribución de energía (por ejemplo un parámetro de si si la energía se encuentra mayormente en frecuencias uencias menores, o en otras palabras, si la representación es l de audio muestra una pendiente en aumento o en dismin uencias mayores. Otras formas de realización también utiliza iciente LPC (LPC = sigla en inglés correspondiente a la traducción ictiva lineal) para generar el parámetro de sibilancia.
Existen dos posibilidades para cambiar el piso de ruido. ificados al decodificador y no se necesitan modificaciones d dificador -puede utilizarse el mismo decodificador. Por l ipulación del piso de ruido puede en principio ser realizada ficador como así también del lado del decodificador.
La replicación de banda espectral como ejemplo de ancho d en cuadros SBR que definen una porción de tiempo en la cual io está separada en componentes en la primera banda de fre nda banda de frecuencia. El piso de ruido puede medirse y/o ca el cuadro SBR. De manera alternativa, es también posible qu se divida en envolventes de ruido, para que para cada envolve realizar un ajuste para el piso de ruido. En otras palabras, l poral resolución de las herramientas del piso de ruido es determi adas envolventes de ruido dentro del cuadro SBR. De acuerdo c /IEC 14496-3), cada cuadro SBR comprende un máximo de dos uido, para que se pueda realizar un ajuste del piso de ruido tenien uadros parciales SBR. Para algunas aplicaciones, esto podría se prende un medidor de piso de ruido para medir los datos del piso gunda banda de frecuencia para una porción de tiempo de la se ÍO el piso de ruido medido ejerce influencia en la tonalidad de io, el medidor del piso de ruido puede comprender un medidor de t a alternativa, el medidor del piso de ruido puede ser implementad ido de una señal para obtener e! piso de ruido. El aparato ademá aracterizador de energía de señal para derivar los datos de di rgía, donde los datos de distribución de energía caracterizan un energía en un espectro de la porción de tiempo de la señal ímente, el aparato comprende un procesador para combinar los d uido y los datos de distribución de energía para obtener datos E.
En otras formas de realización, caracterizador de energía pta para usar el parámetro de sibilancia como datos de distribució parámetro de sibilancia puede, por ejemplo, ser el primer coefici s formas de realización, el procesador se adapta para agregar En otras formas de realización, la porción de tiempo es un cua cterizador de energía de señal se adapta para generar una lventes de piso de ruido por cuadro SBR. En consecuencia, el de ruido como el caracterizador de energía de señal pueden ad ir los datos del piso de ruido como también los datos de la dis gía derivados para cada envolvente de piso de ruido. La lvente de piso de ruido puede, por ejemplo ser 1 , 2, 4, ... por cuad Otras formas de realización comprenden además una her icación de banda espectral utilizada en un decodificador p ponentes en una segunda banda de frecuencia de la señal de au ración se utilizan datos de salida de replicación de banda esentación espectral de señal cruda para los componentes en da de frecuencia. La herramienta de replicación de band prende una unidad de cálculo del piso de ruido, configurada par de ruido de acuerdo con los datos de distribución de en binador para combinar la representación espectral de señal co l de piso de ruido. Para señales de discurso vocalizado (deri isión de conmutación externa) se realiza un análisis de discurso a rminar la vocalización de la señal real. La cantidad de ruido a a dificador o codificador es escalada dependiendo del grado trario al de vocalización) de la señal. El grado de sibilancia rminado, por ejemplo, midiendo la pendiente espectral de las al corta. ve Descripción de los Dibujos La presente invención será descripta a continuación a modo rativos. Las características de la invención serán apreciadas lidad y mejor comprensión teniendo en cuenta la siguiente liada, que debería ser considerada con referencia a los dibuj de: explica el cálculo de la pendiente espectral m basada e de parámetros LPC; ig. 3 muestra un diagrama de bloque de un codificador; ig. 4 muestra diagramas de bloque para procesar la secuen codificada para emitir muestras PCM (sigla en inglés corr a la traducción modulación por código de pulso) d decodificador; ig. 5a, b muestra una comparación de una herramienta convencional de piso de ruido con una herramienta modificada de piso de ruido de acuerdo con las realización; y ig. 6 ilustra la partición de un cuadro SBR en una cantidad pre de porciones de tiempo. esador 130. El medidor de piso de ruido 110 se adapta p rminar los datos del piso de ruido 115 de la segunda banda d para una porción de tiempo de la señal de audio 105. En detall puede ser determinado al comparar el ruido medido de la banda medido de la banda superior, para que la cantidad de ruid ués de la implementación del parche ("patch") para reproducir u onalidad natural pueda ser determinada. El caracterizador de ener deriva los datos de distribución de energía 25 caracterizando un nergía en un espectro de porción de tiempo de la señal de au , el medidor de piso de ruido 110 recibe, por ejemplo, la primera a de frecuencia 105a,b y el caracterizador de energía de señal ejemplo, la primera y/o segunda banda de frecuencia 105af b. El recibe los datos del piso de ruido 115 y los datos de distribució y los combina para obtener los datos de salida BWE 102. La re da espectral comprende un ejemplo para la ampliación de anch de los datos de salida BWE 102 se transforman en datos de sali ientes formas de realización describen principalmente el ejemplo d mplo, definirse como componentes de frecuencia sobre un valor ede estar dado, por ejemplo, por 4 kHz y la banda base (banda in r los componentes de la señal, que se encuentren debajo de este frecuencia (por ejemplo, debajo de 4 kHz u otra frecuencia). Ej e valor umbral de frecuencias serían 5 kHz o 6 kHz.
Las Figs. 2a y 2b muestran dos distribuciones de energía en tro de una porción de tiempo de la señal de audio 105. Las distri rgía mostradas por un nivel P como una función de la frecuencia loga, que puede también ser una envolvente de una señal d alidad de muestras o líneas (transformada en dominio de frec ieos mostrados están más simplificados para visualizar el diente espectral. La banda de frecuencia superior e inferior pue o frecuencias por debajo o sobre el valor umbral de frecuencia F ruce, por ejemplo 500 Hz, 1 kHz o 2 kHz), La Fig. 2a muestra una distribución de energía que exhibe u La Fig. 2b muestra el caso, donde el nivel P aumenta con las plicando una pendiente espectral positiva (una función en aument ndiendo de las frecuencias). Por lo tanto, el nivel P comprende u ctral positiva si el nivel de señal P indica que hay más energía rior (F > F0) comparado con la banda inferior (F < F0). Dicha di rgía es generada si la señal de audio 105 comprende, por ejer antes.
La Fig. 2a ilustra un espectro de potencia de una señal co ctral negativa. Una pendiente espectral negativa significa una p a espectral. En contraposición, la Fig. 2b ilustra un espectro de señal con pendiente espectral positiva. En otras palabras, est ctral posee una pendiente en ascenso. Naturalmente, cada espe ctro ilustrado en la Fig. 2a o el espectro ilustrado en la Fig. ciones en una escala local que posee inclinaciones diferentes de ctral.
La publicación "Cálculo eficiente de la pendiente espectral d metros LPC" por V. Goncharoff, E. Von Colín y R. Morris, Naval trol and Ocean Surveillance Center (NCCOSC), RDT y E División, 92152-52001 , 23 de Mayo 23, 1996 divulga varias maneras d iente espectral.
En una realización, la pendiente espectral se define como la in función lineal de cuadrados mínimos contenida dentro espectral rítmico. Sin embargo, las funciones lineales al espectro de rítmicos o al espectro de amplitud u otro tipo de espectro pueden ados. Esto es específicamente cierto en el contexto de la present e, en la forma de realización preferida, uno está principalmente i igno de la pendiente espectral, es decir, donde el result lazamiento del función lineal es positivo o negativo. El valo iente espectral, sin embargo, no radica gran importancia en la al a forma de realización de la presente invención, pero el valor re rtante en formas de realización más elaboradas. sferencia del dominio z H(z) del filtro LPC. La próxima ecuación pendiente espectral en términos de coeficientes cepstrales. Espe S la pendiente espectral, k y n son enteros y N es el mayor polo élo de todos los polos para H(z). La próxima ecuación en la Fi ctro de potencia logarítmico S(oo) del filtro LPC orden Nth. G es anancia y a? son los coeficientes de predicción lineal, y ? es ig de f es la frecuencia. La ecuación menor en la Fig. 2c directamen coeficientes cepstrales como función de los coeficientes L icientes cepstrales ck son utilizados para calcular la pendien eralmente, este método será más eficiente computacionalm orización polinomial de LPC para obtener los valores de polo, y endiente espectral utilizando ecuaciones del polo. En consecuen aber calculado los coeficientes LPC ak, uno puede calcular los strales ck utilizando la ecuación en la parte inferior de la Fig. 2c den calcular los poles pn desde los coeficientes cepstrales iera ecuación de la Fig. 2c. Luego, teniendo en cuenta los polo ular la pendiente espectral m como se define en la segunda ec ig. 2c, el signo de pendiente espectral m es inverso al signo iciente LPC ai en la definición de coeficiente LPC de la Fig. 2c.
Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, uñ n signo de la pendiente espectral de la señal de audio en una po actual de la señal de audio.
Preferentemente, el caracterizador de energía de señal igurado para generar, como datos de distribución de energía, d lisis LPC de una porción de tiempo de la señal de audio para e coeficientes LPC de bajo orden y derivar los datos de distribució de los coeficientes LPC de bajo orden.
Preferentemente, el caracterizador de energía de señal igurado sólo para calcular el primer coeficiente LPC y no p icientes LPC adicionales y para derivar los datos de distribución d uericias menores a frecuencias mayores, cuando el primer coe e un signo negativo.
En otras formas de realización, el detector de pendiente espectr cterizador de energía de señal 120 está configurado no sólo para icientes LPC de primer orden sino para calcular varios coeficíe orden como los coeficientes LPC hasta el orden de 3 ó 4 ó au a forma de realización, la pendiente espectral se calcula hasta dic que no sólo se puede indicar el signo como parámetro de sib bién un valor que depende de la pendiente, que posee más de o en el signo de la forma de realización.
Como se explicó previamente la sibilancia comprende una gran rgía en al región de frecuencia superior, mientras que para part a sibilancia (por ejemplo, vocales) la energía es mayormente distri a banda base (banda de frecuencia baja). Esta observación pue el fin de determinar si o hasta donde una parte de señal de voz c e el primer coeficiente LPC se puede inferir el comportamien ción de aumento o disminución). Este análisis puede realizars cterizador de energía de señal 120. En caso que el codificador para la decodificación de la señal de audio, no habrá necesidad arámetro de sibilancia, ya que el primer coeficiente LPC puede o datos de distribución de energía del lado del decodificador.
En algunas formas de realización el procesador 130 igurado para cambiar los datos del piso de ruido 115 de acuerdo c distribución de energía 125 (pendiente espectral) para ob ificados del piso de ruido, y el procesador 130 puede estar confi gar los datos modificados del piso de ruido a una secuencia prende datos de salida de BWE 102. El cambio de datos del piso de ser tal que el piso de ruido modificado aumenta para una se que comprende mayor sibilancia (Fig. 2b) en comparación con u io 105 que comprende menor sibilancia (Fig. 2a). uiador de datos de la envolvente 210. El codificador 300 co ada para muestras PCM (señal de audio 105; PCM = modulació ulso), conectada al banco de análisis QMF 320, y a los módulos BWE 310 y al filtro LP 330. El banco de análisis QMF 320 puede iltro de paso alto para separar la segunda banda de frecuenci ecta al calculador de datos de la envolvente 210, que a la vez se ormateador de secuencia de bits de carga útil 350. El filtro L prender filtro de paso bajo para separar la primera banda de fr leo 105a y se conecta con el codificador de núcleo AAC 340, qu ecta con el formateador de secuencia de bits de carga útil 350. Fi ulo relacionado con BWE 310 se conecta al calculador de olvente 210 y al codificador de núcleo AAC 340.
En consecuencia, el codificador 300 realiza un sub-muestreo d io 105 para generar componentes en la banda de frecuencia de el filtro LP 330), que son ingresados en el codificador de núcle codifica la señal de audio en la banda de frecuencia de núcleo y e stras de sub-bandas) es valuada en forma compleja y por lo tanto obre-muestreo por un factor de dos en comparación con un lar.
El módulo relacionado con BWE 310 puede por ejemplo, co rato 100 para generar datos de salida de BWE 102 y controla el C s de la envolvente 210 proporcionando, por ejemplo, datos de (parámetro de sibilancia) al calculador de datos de la env zando los componentes de audio 105b generados por el banc F 320, el calculador de datos de la envolvente 210 calcula los y envía los datos BWE 375 al formateador de secuencia de bits , que combina los datos BWE 375 con los componentes 355 codifi ificador de núcleo 340 en la secuencia de audio codificada 345. uiador de datos de la envolvente 210 puede por ejemplo usar el ancia 125 para ajustar el piso de ruidos dentro de las envolventes En forma alternativa, el aparato 100 para generar datos de de los datos BWE 375. La señal de audio codificada 355 es in plo, en un decodificador de núcleo AAC 360, que genera la se dificada 105a en la primera banda de frecuencia. La señal de ponentes en la primera banda de frecuencia) es ingresada en un nálisis de banda 32 370, que genera, por ejemplo, sub-bandas d 0532 desde la señal de audio 105a en la primera banda de fre bandas de frecuencia de la señal de audio 10532 ingresan en el g he 410 para generar una representación espectral de seña che), que ingresa en una herramienta BWE 430a. La herramienta de, por ejemplo, comprender una unidad de cálculo de piso d erar un piso de ruido. Además, la herramienta BWE 430a pued onías perdidas o realizar un paso de filtrado inverso. La herra a puede implementar métodos conocidos de replicación de band ar en la salida de datos espectrales QMF del generador de parch . El algoritmo de implementación de parches ("patching") usado e recuencia podría, por ejemplo, emplear el método de espejo copia atos espectrales dentro del dominio de frecuencia. hes ("patching") específico) y el parámetro BWE 102 comprende, bién los datos de distribución de energía 125 (por ejemplo el p ancia). La información de control 412 ingresa a la herramienta BW metros de replicación de banda espectral 102 ingresan a la herra a y a un ajustador de envolvente 430b. El ajustador de envolve rativo para ajustar la envolvente para el parche generado. En con tador de envolvente 430b genera la señal cruda ajustada 1 unda banda de frecuencia y la ingresa en un banco QMF de síntes combina los componentes de la segunda banda de frecuencia al de audio en dominio de frecuencia 10532. El banco QMF de de, por ejemplo, comprender 64 bandas de frecuencia y genera as señales (los componentes en la segunda banda de frecuen al de audio en dominio de frecuencia 10632) la señal de audio de ejemplo, salida de muestras PCM, PCM = modulación de código El banco QMF de síntesis 440 puede, por ejemplo, co binador, que combina la señal en dominio de frecuencia 10532 co eo 340 y son usados para sintetizar los componentes de la segun uencia 105b exhiben la tonalidad de la segunda banda de frecue ñal original. Especialmente en vías de discurso vocalizado, sin o adicional agregado por la herramienta convencional de piso de ar la calidad percibida de la señal reproducida.
De acuerdo con las formas de realización la herramienta del de ser modificada para que la herramienta del piso de ruido tome s de distribución de energía 125 (parte de los datos BWE 102) ÍSO de ruido según el grado de sibilancia detectado (ver Fig. rnativo, como se describe antes el decodificador no puede ificado y en cambio el codificador puede cambiar los datos del ún el grado de sibilancia detectado.
La Fig. 5 muestra una comparación de una herramienta vencional del piso de ruido con una herramienta de cálculo modifi uido de acuerdo con las formas de realización de la presente inv mitidos desde el codificador como parte de la secuencia de audi La representación espectral de señal cruda 425 se obtiene, por enerador de parche, que genera componentes de la señal de a de frecuencia superior (componentes sintetizados en la segun encia 105b). Las líneas espectrales crudas y líneas espectral n además procesadas, lo cual incluirá un filtrado inverso, lvente, adición de armonía perdida etc. Finalmente, un com bina las líneas espectrales crudas con las líneas espectral uladas a los componentes en la segunda banda de frecuencia 105 La Fig. 5b muestra una herramienta de cálculo del piso de ruido las formas de realización de la presenté invención. Además, de la álculo convencional del piso de ruido de la Fig. 5a, las formas d prenden una unidad modificadora del piso de ruido 431 confi plo, para modificar los datos transmitidos del piso de ruido bas s de distribución de energía 125 antes de ser procesados en la álculo del piso de ruido 433. Los datos de distribución de energía ejemplo una relación lineal) entre la disminución/aumento y ? ctral.
Teniendo en cuenta estos datos modificados del piso amienta de cálculo del piso de ruido 433 calcula nuevament ctrales crudas y las líneas espectrales de ruido modificado b esentación espectral de señal cruda 425, que nuevamente pued e un generador de parche. La herramienta de replicación de ban de la Fig. 5b comprende además un combinador 434 para s espectrales crudas con el piso de ruido calculado (con la e la unidad modificadora 431 ) para generar los componentes en da de frecuencia 105b.
Los datos de distribución de energía 125 pueden indicar en le una modificación en el nivel de datos transmitidos del piso de xplicó anteriormente, se puede utilizar también el primer coeficient s de distribución de energía 125. En consecuencia, si la señal d tras formas de realización los datos de distribución de energía sarse directamente en el calculador 433 modificando directamen iso de ruido como parámetro de cálculo. Por lo tanto, la unidad i piso de ruido 431 y el calculador/procesador 433 pueden combi amienta de modificadora del piso de ruido 433, 431.
En otra forma de realización la herramienta BWE 430 que c amienta de cálculo del piso comprende un conmutador, donde el configurado para conmutar entre un nivel alto para el piso de ruid ctral positiva) y un nivel bajo para el piso de ruido (pendien tiva). El nivel alto puede, por ejemplo, corresponder al caso do smitido para el ruido es duplicado (o multiplicado por un factor), ivel bajo corresponde al caso donde el nivel transmitido disminuy onmutador puede ser controlado por un bit en la secuencia de bit udio codificada 345 indicando una pendiente espectral positiva o ñal de audio. En forma alternativa el conmutador puede activarse lisis de la señal de audio decodificada 105a (componentes en la pri Aunque algunas de las Figs. 1 , 3 a 5 se ilustran como diagram os aparatos, estas figuras simultáneamente son ilustraciones de e las funcionalidades del bloque corresponden a los pasos del mé Como se explico anteriormente, una unidad de tiempo SBR (cu ión de tiempo pueden dividirse en varios bloques de dato lventes. Esta partición puede ser uniforme en todo el cuadro S tar flexibilidad a la síntesis de la señal de audio dentro del cuadro La Fig. 6 ilustra dicha partición para el cuadro SBR en una ca lventes. El cuadro SBR cubre un periodo de tiempo o porción e el tiempo inicial to y el tiempo final tn. La porción de tiemp plo, dividida en ocho porciones de tiempo, una primera porció una segunda porción de tiempo T2, una octava porción de tie ejemplo, el número máximo de envolventes coincide con el iones de tiempo y está dado por n = 8. Las 8 porciones de tiemp n separadas por 7 bordes, lo que implica que un borde 1 separa lventes de ruido cubran diferentes longitudes de tiempo. En det dos envolventes de ruido (n = 2) comprende una primera envolv nde desde el tiempo t0 por las primeras cuatro porciones de tie T4) y la segunda envolvente de ruido que cubre de la quinta ión de tiempo (T5, T6, T7 y T8). Debido a la Norma ISO/IEC idad máxima de envolventes se restringe a dos. Pero las formas d en usar cualquier cantidad de envolventes (por ejemplo dos, C lventes).
En otras formas de realización el calculador de datos de en configurado para cambiar la cantidad de envolventes dependiend os datos medidos del piso de ruido 115. Por ejemplo, si los datos de ruido 115 indican un piso de ruido variado (por ejemplo s ral) la cantidad de envolventes puede aumentar mientras en c s del piso de ruido 115 indican un ruido constante en el piso tidad de envolventes puede disminuir.
Aunque algunos aspectos han sido descriptos en el cont ato, queda claro que estos aspectos también representan una de do correspondiente, donde un bloque o dispositivo corresponde a do o rasgo de un paso del método. En forma análoga, los aspecto l contexto de un paso del método también representan una descr ue o ítem correspondiente o rasgo de un aparato correspondiente La señal de audio codificada de invención puede almacenarse lmacenamiento digital o transmitida en un medio de transmisi io de transmisión inalámbrico o por cable como la Internet.
Dependiendo de ciertos requisitos de implementación, las ización de la invención pueden implementarse en hardware o ementación puede realizarse utilizando un medio de almacena ejemplo un disquete, DVD, CD, memoria ROM, PROM, EPROM, SH, con señales de control capaces de ser leídas en forma cenados en ellos, que cooperan (o son capaces de cooperar) co Generalmente, las formas de realización de la presente inven ementarse como un producto de programa de computación con rama, el código de programa es operativo para desarrollar odos cuando el producto de programa de computación es utili putadora. El código de programa puede por ejemplo ser almac ador capaz de ser leído por una máquina.
Otras formas de realización comprenden el programa de comp arrollar uno de los métodos descriptos en la presente, almac ador capaz de ser leído por una máquina.
En otras palabras, una forma de realización del método siste, por lo tanto, en un programa de computación con un código desarrollar uno de los métodos descriptos en la presente rama de computación es utilizado en una computadora.
Otra forma de realización del método de invención consiste, po ser transferida a través de una conexión de comunicación d plo por Internet.
Otra forma de realización comprende un medio de procesa ipio una computadora, o un dispositivo lógico programable, c tado para desarrollar uno de los métodos descriptos en la presen Otra forma de realización comprende una computadora con putación instalado en la misma, para desarrollar uno de lo riptos en la presente.
En algunas formas de realización, un dispositivo lógico progr plo una matriz de puertas programables por campo) puede úti rrollar una de las funcionalidades de los métodos descriptos en lgunas formas de realización, una matriz de puertas programable e cooperar con un microprocesador con el fin de desarrollar odos descriptos en la presente. Generalmente, los m por los detalle específicos presentados a modo de descripción s formas de realización de la presente.

Claims (1)

  1. I 33· REIVINDICACIONES Habiendo así especialmente descripto y determinado la natu enté invención y la forma como la misma ha de ser llevada a la ara reivindicar como de propiedad y derecho exclusivo Un aparato (100) para generar datos de salida del ancho de para una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) y c en una segunda banda de frecuencia (105b), los datos de sali de banda (102) están adaptados para controlar una sínt componentes en la segunda banda de frecuencia (105b), comprende: un medidor del piso de ruido (1 10) para medir los datos del (1 15) de la segunda banda de frecuencia (105b) para una tiempo (T) de la señal de audio (105); El aparato (100) de la reivindicación 1 , donde el caracterizado de la señal (120) está configurado para utilizar, como datos de de energía (125), un parámetro de sibilancia o un parámetro d espectral, el parámetro de sibilancia o parámetro de pendiente nivel en aumento o disminución de la señal de audio (105) co (F). El aparato (100) de la reivindicación 2, donde el caracterizado de la señal (120) está configurado para utilizar la primera predictiva lineal como parámetro de sibilancia. El aparato (100) de una de las reivindicaciones precedente procesador (130) está configurado para agregar los datos del p (115) y datos de distribución de energía espectral(125) a una s bits como los datos de salida BWE (102). El aparato (100) de la reivindicación 5, donde el cambio de da de ruido (115) es tal que el piso de ruido modificado aumen señal de audio (105) que comprende mayor sibilancia en com una señal de audio (105) que comprende menor sibilancia. Un codificador (300) para codificar una señal de audio (105), audio (105) comprende componentes en una primera banda d (105a) y componentes en una segunda banda de frecuenci codificador comprende: un codificador de núcleo (340) para codificar los componentes e banda de frecuencia (105a); un aparato (100) para generar datos de salida BWE (102) de una de las reivindicaciones 1 a 6; y un calculador de datos de la envolvente (210) para calcular da para diferentes envolventes de ruido de la pluralidad de en ruido. El codificador (300) de la reivindicación 7 o reivindicació calculador de datos de la envolvente (210) está configurado p una cantidad de envolventes que dependen de un cambio medidos del piso de ruido (115). Un método para generar datos de salida del ancho de banda una señal de audio (105), la señal de audio (105) comprende c en la primera banda de frecuencia (105a) y componentes en banda de frecuencia (105b), los datos de salida del ancho de se adaptan para controlar una síntesis de los componentes e banda de frecuencia (105b), el método comprende: la medición de datos del piso de ruido (115) de la segund frecuencia (105b) para una porción de tiempo (T) de la se Una herramienta de ancho de banda (430) para generar com una segunda banda de frecuencia (105b) de una señal de basada en los datos de salida del ancho de banda (102) y b representación espectral de señal cruda (425) para los compo segunda banda de frecuencia 105b), donde los datos de salid de banda (102) comprenden datos de distribución de energí datos de distribución de energía (125) caracterizan una dis energía en un espectro de una porción de tiempo (T) de la se (105), la herramienta de ancho de banda (430) comprende: una herramienta modificadora del piso de ruido (433, 431), confi modificar un piso de ruido transmitido de acuerdo con l distribución de energía (125); y un combinador (434) para combinar la representación espect cruda (425) con el piso de ruido modificado para generar los c donde la herramienta modificadora del piso de ruido (433 adaptada para aumentar el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la segund frecuencia (105b) que en la primera banda de frecuencia para disminuir el nivel de ruido en caso que los datos de de energía (125) indiquen una señal de audio (105) que mayor energía en los componentes de la primer frecuencia (105a) que la segunda banda de frecuencia (1 Un decodificador (400) para decodificar una secuencia de audi (345) para obtener una señal de audio (105) que comprende: un desformateador de secuencia de bits (357) que separ una unidad de síntesis (440) para sintetizar la señal de combinando los componentes de la primera y segunda frecuencia (105a, 105b). Un método para decodificar una secuencia de audio codificad obtener una señal de audio (105), la señal de audio (105) componentes en una primera banda de frecuencia (105a) dat del ancho de banda (102), donde los datos de salida del anc (102) comprenden datos de distribución de energía (125) y d de ruido, los datos de distribución de energía (125) cara distribución de energía en un espectro de una porción de tie señal de audio (105), el método comprende: la separación de la secuencia de audio codificada (345) de audio codificada (355) y los datos de salida de BWE (102); los componentes de decodificación en una primera banda d la combinación de representación espéctral de señal cruda ( piso de ruido modificado para generar los componentes en banda de frecuencia (105b) con el piso de ruido calculado; y la sintetización de la señal de audio (105) combinando los com la primera y segunda banda de frecuencia (105a, 105b). Un programa de computación para desarrollar, al ser utiliz computadora, el método de la reivindicación 10 o reivindicación 1 Una secuencia de audio codificada (345) que comprende: una señal de audio codificada (355) para componentes en una pri de frecuencia (105a) de una señal de audio (105); datos del piso de ruido adaptados para controlar una síntesis d ruido para componentes en una segunda banda de frecuencia
MX2011000361A 2008-07-11 2009-06-23 Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. MX2011000361A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7984108P 2008-07-11 2008-07-11
PCT/EP2009/004521 WO2010003544A1 (en) 2008-07-11 2009-06-23 An apparatus and a method for generating bandwidth extension output data

Publications (1)

Publication Number Publication Date
MX2011000361A true MX2011000361A (es) 2011-02-25

Family

ID=40902067

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2011000361A MX2011000361A (es) 2008-07-11 2009-06-23 Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda.
MX2011000367A MX2011000367A (es) 2008-07-11 2009-06-23 Un aparato y un metodo para calcular una cantidad de envolventes espectrales.

Family Applications After (1)

Application Number Title Priority Date Filing Date
MX2011000367A MX2011000367A (es) 2008-07-11 2009-06-23 Un aparato y un metodo para calcular una cantidad de envolventes espectrales.

Country Status (20)

Country Link
US (2) US8296159B2 (es)
EP (2) EP2301027B1 (es)
JP (2) JP5628163B2 (es)
KR (5) KR101395257B1 (es)
CN (2) CN102144259B (es)
AR (3) AR072480A1 (es)
AU (2) AU2009267530A1 (es)
BR (2) BRPI0910523B1 (es)
CA (2) CA2730200C (es)
CO (2) CO6341676A2 (es)
ES (2) ES2398627T3 (es)
HK (2) HK1156141A1 (es)
IL (2) IL210196A (es)
MX (2) MX2011000361A (es)
MY (2) MY155538A (es)
PL (2) PL2301028T3 (es)
RU (2) RU2494477C2 (es)
TW (2) TWI415114B (es)
WO (2) WO2010003546A2 (es)
ZA (2) ZA201009207B (es)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
ES2655085T3 (es) 2010-03-09 2018-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Respuesta de magnitud y alineamiento temporal mejorado en la extensión de ancho de banda basado en un vocodificador de fase para señales de audio
CN103038819B (zh) 2010-03-09 2015-02-18 弗兰霍菲尔运输应用研究公司 用以使用补丁边界对准处理输入音频信号的装置及方法
WO2011110496A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
CN102971788B (zh) * 2010-04-13 2017-05-31 弗劳恩霍夫应用研究促进协会 音频信号的样本精确表示的方法及编码器和解码器
CN102947882B (zh) * 2010-04-16 2015-06-17 弗劳恩霍夫应用研究促进协会 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5633431B2 (ja) * 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2012158333A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
CN103959376B (zh) * 2011-12-06 2019-04-23 英特尔公司 低功率语音检测
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
JPWO2014034697A1 (ja) * 2012-08-29 2016-08-08 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
ES2790733T3 (es) * 2013-01-29 2020-10-29 Fraunhofer Ges Forschung Codificadores de audio, decodificadores de audio, sistemas, métodos y programas informáticos que utilizan una resolución temporal aumentada en la proximidad temporal de inicios o finales de fricativos o africados
RU2608447C1 (ru) * 2013-01-29 2017-01-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов
MY180912A (en) 2013-01-29 2020-12-11 Fraunhofer Ges Forschung Noise filling without side information for celp-like coders
CN105247613B (zh) 2013-04-05 2019-01-18 杜比国际公司 音频处理系统
CN110265047B (zh) 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
ES2635026T3 (es) 2013-06-10 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
RU2662921C2 (ru) 2013-06-10 2018-07-31 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
ES2697474T3 (es) * 2013-06-21 2019-01-24 Fraunhofer Ges Forschung Decodificador de audio que tiene un módulo de extensión de ancho de banda con un módulo de ajuste de energía
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9747909B2 (en) * 2013-07-29 2017-08-29 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
ES2742420T3 (es) * 2013-12-02 2020-02-14 Huawei Tech Co Ltd Método y aparato de codificación
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10120067B2 (en) 2014-08-29 2018-11-06 Leica Geosystems Ag Range data compression
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
PT3405951T (pt) * 2016-01-22 2020-02-05 Fraunhofer Ges Forschung Aparelhos e métodos para codificar ou descodificar um sinal de áudio multicanal utilizando sincronização de controlo de quadro
CN105513601A (zh) * 2016-01-27 2016-04-20 武汉大学 一种音频编码带宽扩展中频带复制的方法及装置
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10084493B1 (en) * 2017-07-06 2018-09-25 Gogo Llc Systems and methods for facilitating predictive noise mitigation
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
US11811686B2 (en) 2020-12-08 2023-11-07 Mediatek Inc. Packet reordering method of sound bar

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
RU2128396C1 (ru) * 1997-07-25 1999-03-27 Гриценко Владимир Васильевич Способ передачи и приема информации и устройство для его осуществления
ES2247741T3 (es) * 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6901362B1 (en) * 2000-04-19 2005-05-31 Microsoft Corporation Audio segmentation and classification
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
JP2004350077A (ja) * 2003-05-23 2004-12-09 Matsushita Electric Ind Co Ltd アナログオーディオ信号送信装置および受信装置並びにアナログオーディオ信号伝送方法
SE0301901L (sv) 2003-06-26 2004-12-27 Abb Research Ltd Metod för att diagnostisera utrustningsstatus
JP4767687B2 (ja) * 2003-10-07 2011-09-07 パナソニック株式会社 スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法
KR101008022B1 (ko) * 2004-02-10 2011-01-14 삼성전자주식회사 유성음 및 무성음 검출방법 및 장치
US20080260048A1 (en) 2004-02-16 2008-10-23 Koninklijke Philips Electronics, N.V. Transcoder and Method of Transcoding Therefore
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
WO2006000110A1 (en) 2004-06-28 2006-01-05 Abb Research Ltd System and method for suppressing redundant alarms
DE602004020765D1 (de) 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
US7676043B1 (en) 2005-02-28 2010-03-09 Texas Instruments Incorporated Audio bandwidth expansion
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US8396717B2 (en) 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
EP1989706B1 (fr) 2006-02-14 2011-10-26 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US20070282803A1 (en) * 2006-06-02 2007-12-06 International Business Machines Corporation Methods and systems for inventory policy generation using structured query language
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
JP2010503881A (ja) 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009081315A1 (en) 2007-12-18 2009-07-02 Koninklijke Philips Electronics N.V. Encoding and decoding audio or speech
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
AU2009220321B2 (en) 2008-03-03 2011-09-22 Intellectual Discovery Co., Ltd. Method and apparatus for processing audio signal
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing

Also Published As

Publication number Publication date
RU2011103999A (ru) 2012-08-20
TWI415114B (zh) 2013-11-11
TW201007700A (en) 2010-02-16
AU2009267530A1 (en) 2010-01-14
KR101395252B1 (ko) 2014-05-15
CA2730200C (en) 2016-09-27
US8296159B2 (en) 2012-10-23
KR101278546B1 (ko) 2013-06-24
JP5628163B2 (ja) 2014-11-19
BRPI0910523A2 (pt) 2020-10-20
CA2729971C (en) 2014-11-04
TWI415115B (zh) 2013-11-11
EP2301028A2 (en) 2011-03-30
IL210330A0 (en) 2011-03-31
JP2011527448A (ja) 2011-10-27
WO2010003544A1 (en) 2010-01-14
US20110202352A1 (en) 2011-08-18
KR101345695B1 (ko) 2013-12-30
WO2010003546A3 (en) 2010-03-04
CN102144259A (zh) 2011-08-03
BRPI0910523B1 (pt) 2021-11-09
JP2011527450A (ja) 2011-10-27
ES2539304T3 (es) 2015-06-29
BRPI0910517A2 (pt) 2016-07-26
RU2011101617A (ru) 2012-07-27
RU2487428C2 (ru) 2013-07-10
KR20110040820A (ko) 2011-04-20
AU2009267532A8 (en) 2011-03-17
ZA201009207B (en) 2011-09-28
KR101395257B1 (ko) 2014-05-15
CA2729971A1 (en) 2010-01-14
CA2730200A1 (en) 2010-01-14
AR072480A1 (es) 2010-09-01
CO6341676A2 (es) 2011-11-21
PL2301028T3 (pl) 2013-05-31
WO2010003546A2 (en) 2010-01-14
CO6341677A2 (es) 2011-11-21
TW201007701A (en) 2010-02-16
IL210196A0 (en) 2011-03-31
MY153594A (en) 2015-02-27
AR097473A2 (es) 2016-03-16
HK1156141A1 (en) 2012-06-01
AR072552A1 (es) 2010-09-08
MY155538A (en) 2015-10-30
CN102089817A (zh) 2011-06-08
EP2301027B1 (en) 2015-04-08
KR20130033468A (ko) 2013-04-03
KR20110038029A (ko) 2011-04-13
BRPI0910517B1 (pt) 2022-08-23
KR20130095840A (ko) 2013-08-28
IL210196A (en) 2015-10-29
AU2009267532A1 (en) 2010-01-14
ZA201100086B (en) 2011-08-31
US20110202358A1 (en) 2011-08-18
EP2301028B1 (en) 2012-12-05
PL2301027T3 (pl) 2015-09-30
MX2011000367A (es) 2011-03-02
EP2301027A1 (en) 2011-03-30
AU2009267532B2 (en) 2013-04-04
RU2494477C2 (ru) 2013-09-27
US8612214B2 (en) 2013-12-17
CN102089817B (zh) 2013-01-09
JP5551694B2 (ja) 2014-07-16
HK1156140A1 (en) 2012-06-01
ES2398627T3 (es) 2013-03-20
CN102144259B (zh) 2015-01-07
KR101395250B1 (ko) 2014-05-15
KR20130095841A (ko) 2013-08-28

Similar Documents

Publication Publication Date Title
MX2011000361A (es) Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda.
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
EP2235719B1 (en) Audio encoder and decoder
EP2950308B1 (en) Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
KR102055022B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
JP2009244886A (ja) 情報源符号化システムの性能向上装置
JP2004053940A (ja) オーディオ復号化装置およびオーディオ復号化方法
WO2013062201A1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
JP4354561B2 (ja) オーディオ信号符号化装置及び復号化装置
AU2013257391B2 (en) An apparatus and a method for generating bandwidth extension output data
Farrugia Combined speech and audio coding with bit rate and bandwidth scalability
Bayer Mixing perceptual coded audio streams

Legal Events

Date Code Title Description
FG Grant or registration