MX2011000379A - Codificador de audio y decodificador de audio. - Google Patents

Codificador de audio y decodificador de audio.

Info

Publication number
MX2011000379A
MX2011000379A MX2011000379A MX2011000379A MX2011000379A MX 2011000379 A MX2011000379 A MX 2011000379A MX 2011000379 A MX2011000379 A MX 2011000379A MX 2011000379 A MX2011000379 A MX 2011000379A MX 2011000379 A MX2011000379 A MX 2011000379A
Authority
MX
Mexico
Prior art keywords
coefficient
audio
segment
context
spectral
Prior art date
Application number
MX2011000379A
Other languages
English (en)
Inventor
Stefan Geyersberger
Bernhard Grill
Markus Multrus
Nikolaus Rettelbach
Guillaume Fuchs
Virgilio Bacigalupo
Original Assignee
Ten Forschung Ev Fraunhofer
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ten Forschung Ev Fraunhofer filed Critical Ten Forschung Ev Fraunhofer
Publication of MX2011000379A publication Critical patent/MX2011000379A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

Un codificador de audio (100) para codificar segmentos de coeficientes, donde los segmentos de coeficientes representan diferentes resoluciones de tiempo o frecuencia de una señal de audio tomada como muestra, donde el codificador de audio (100) comprende un procesador (110) para derivar un contexto de codificación para un coeficiente que se está codificando de un segmento actual sobre la base de un coeficiente anteriormente codificado de un segmento anterior, donde el coeficiente anteriormente codificado representa una resolución diferente de tiempo o frecuencia que el coeficiente que se está codificando actualmente. El codificador de audio (100) comprende además un codificador por entropía (120) para codificar por entropía el coeficiente actual sobre la base del contexto de codificación para obtener una secuencia de audio codificada.

Description

Codificador de Audio y Decodificador de Audio presente invención se relaciona con el campo de la codificaci ecialmente con el campo de la codificación de entropía basada en conceptos tradicionales de codificación de audio incluyen un ificación de entropía par la reducción de redundancia. Por l ificación de entropía se aplica a coeficientes espectrales cua uemas de codificación basados en el dominio de la frecuencia o inio del tiempo cuantizadas para esquemas de codificación b inio del tiempo. Estos esquemas de codificación de entropía hac eral, de la transmisión de una palabra codificada en combinación un libro de codificación consiguiente, que faculta a un deco car una determinada página del libro de codificación para de abra de información codificada correspondiente a la palabra cla dicha página. Sin embargo, en algunos conceptos de co smisión del índice del libro de codificación puede no ser impre mplo coeficientes espectrales cuantizados, que son precedentes frecuencia. En algunos de los conceptos convencionales, es dén estar disponibles tanto en el lado del codificador como del de re la base de estos símbolos, se puede determinar un libro de texto en forma sincrónica tanto del lado del codificador como del d Fig. 9 ilustra un ejemplo de contexto y sus dependencias. La Fig. no de frecuencia, en el cual se ha indicado un número de símbolo denota un símbolo en el tiempo n y la frecuencia m. La Fig. 9 de a codificar un determinado símbolo, se utiliza su contexto para o de codificación asociado. Por ejemplo, en el caso del símbol respondería a todos los símbolos con nO y todo m, o con n = nO y m < mO. implementaciones prácticas, un contexto no es infinito sino li mplo ilustrado en la Fig. 9, el contexto del símbolo So,3 podría ser, 2, So,1, S_1,5, S-1 ,4, S-1 ,3, S-1 ,2, S-1 ,1 , S-2,5, S-2,4. S_2>3, S_2,2, S_2,1 . otras palabras, dentro de estos conceptos de codificación de aud ducir, con el tiempo, cambios de resolución por frecuencia/tiempo. codificación de audio popular es el denominad AAC (del in anced Audio Coding (Codificación Avanzada de Audio)), en C izan dos longitudes de bloques, para lo cual se codifican, por ej 4 coeficientes transformados que representan los componentes 256 o 2048 muestras de dominio del tiempo en ventanas, respecti os conceptos permiten la conmutación entre diferentes endiendo de ciertas características de las señales, como po rición de transitorios o la tonalidad o si la señal es del tipo musi En el caso de la conmutación entre diferentes res po/frecuencia, como por ejemplo entre diferentes tipos de blo texto no es estable. Los conceptos convencionales o las impleme ado actual de la técnica pueden utilizar el reinicio del contexto, icamente se conmuta a un estado en el cual no se dispone de nin de el contexto se construye comenzando de cero. Este enfoq ificación subóptimos. La desventaja en la eficiencia de codificad ma en casos en los cuales la conmutación sólo tiene lugar ocasió bargo, en una situación en la que se produce una conmutación m o lleva a una pérdida significativa de eficiencia de codificación. Po mutación más frecuente es muy conveniente en el caso de vel as de datos/muestreo, ya que, especialmente en este caso, es co ptación. Por otro lado, la eficiencia de codificación se reduce signi la conmutación frecuente. bjetivo de la presente invención es dar a conocer un concepto p re transformadas de diferente longitud en la codificación de au ar a una eficiencia de codificador mejorada. objetivo se alcanza mediante un codificador de audio de ac indicación 1 , un método para la codificación de audio de ac indicación 8, un decodificador de audio de acuerdo con la reivindi todo para la decodificación de audio de acuerdo con la reivindicaci dén derivar contextos para los coeficientes que tienen las nuevas los coeficientes que tienen las resoluciones precedentes. Es un h sente invención que se puede utilizar, por ejemplo, interpolación, muestreo, diezmado o reducción de la resolución (downsamplin secuencias (upsampling), etc, para la adaptación y/o derivación d rcambiar las resoluciones de tiempo/frecuencia en la codificación realizaciones de la presente invención presentan un método de pea la frecuencia o los coeficientes espectrales de un contexto g refiere a una resolución anterior, con respecto a la resolución de contexto actual o un cuadro actual. En otras palabras, se pu rmación de contexto anterior para la determinación del libro de co ir para derivar nueva información de contexto. Las realizaci mitir, por esta razón, una conmutación más frecuente de longitud or lo tanto, una mejor adaptación a las características de la se iencia de codificación.
Fig. 3 ilustra una realización correspondiente a una e uencias de un contexto; Fig. 4 ilustra una realización correspondiente a un diezmado d Fig. 5 ilustra un audio con conmutación de resoluciones frecuencia; Fig. 6 Ilustra una implementación de una realización; Fig. 7a exhibe un gráfico de flujo de una realización de u codificación; Fig. 7b ilustra el procedimiento general de actualización de acuerdo con una realización; Fig. 7c ilustra el procedimiento general de actualización de Fig. 1 ilustra una realización de un codificador de audio 100 mentos de coeficientes, segmentos de coeficientes que represent oluciones de tiempo o frecuencia de una señal de audio m ificador de audio 100 comprende un procesador 110 para deriva codificación para un coeficiente codificado actualmente de un se ase de un coeficiente codificado precedentemente de un segm de el coeficiente precedentemente codificado representa un rente de tiempo o frecuencia que el coeficiente codificado en este lización del codificador de audio comprende además un codificad para codificar por entropía el coeficiente actual sobre la base d ificación para obtener una secuencia de audio codificada. ciertas realizaciones, los coeficientes pueden corresponder a io, muestras de audio cuantizadas, coeficientes espectrales o d ficientes escalados, coeficientes transformados o filtrados, etc. binación de los mismos. coeficientes por ancho de banda, es decir una resolución es uencia diferente. El medio de obtención puede estar adaptado pa mentos de 1024 y 128 coeficientes de tiempo, frecuencia o espec rocesador 110 puede estar adaptado, en algunas realizaciones, ? texto de codificación sobre la base de las representaciones d uencia o espectrales de los coeficientes o segmentos actuales y otras palabras, en algunas realizaciones, los segmentos suce ar representados en diferentes dominios de tiempo y/o ectrales. El procesador 110 puede estar adaptado para derivar e ificacion por banda de frecuencia o espectral del segmento e mplo basándose en los coeficientes espectrales vecinos d cedentes y/o del segmento actual. En algunas realizaciones, erminar los segmentos, en un principio, en el dominio de tiempo, ventana una secuencia de audio de entrada. Basándose en estos ficientes de dominio de tiempo, se pueden determinar s ficientes de domino de la frecuencia o espectrales mediante tr procesador 110 y el codificador por entropía 120 puede estar con cionar basándose en un diezmado de los coeficientes de ectrales de un segmento anterior cuando un segmento anterior q ontexto comprende una resolución espectral o de frecuencia m mento actual. En algunas realizaciones el procesador 110 y el c ropía 120 pueden estar configurados para operar sobre la ansión de secuencias de los coeficientes de frecuencia o espe mento anterior, cuando un segmento anterior que pertenece prende una resolución espectral o de frecuencia más gruesa qu ual. realizaciones pueden ofrecer un método para codificar s ficientes que representan diferentes resoluciones de tiempo o señal de audio tomada como muestra. El método puede compre derivar un contexto de codificación para un coeficiente actual o e momento de un segmento actual sobre la base de un coeficie es codificado de un segmento anterior y basado también, opcion consecuencia, las realizaciones pueden comprender un decodific del cual se ilustra una realización en la Fig. 2. El decodificador á adaptado para decodificar una secuencia de audio codificada a f mentos de coeficientes que representan resoluciones de tiempo una señal de audio tomada como muestra; el decodificador d prende un procesador 210 para derivar un contexto de codifica ficiente decodificado en este momento o actual sobre la base de eriormente decodificado o anterior, donde el coeficiente ificado o anterior representa una resolución de tiempo o frecuenci el coeficiente que se está decodificando. Más aún, el decodific comprende un decodificador por entropía 220 para decodificar p ficiente en curso sobre la base del contexto de codificación y la io codificada. ciertas realizaciones, el decodificador de audio 200 puede co odificador por entropía 220, que está adaptado para determinar l coeficientes decodificados sobre la base de diferentes longitude ciertas realizaciones, el procesador 210 puede estar adaptado p texto de codificación por cada banda de frecuencia o espectral ual, por ejemplo sobre la base de coeficientes espectrales mento o segmentos precedentes y, opcionalmente, del segmento s palabras, se pueden procesar los segmentos en el dominio de spectral, lo que se puede realizar por cada banda de frecuenci r consiguiente, el procesador 210 puede estar adaptado entonce contexto que corresponde a una banda de frecuencia o espectral decodificador por entropía 200 puede estar adaptado codificar p ficiente actual sobre la base de una regla de codificación por gitud variable. procesador 210 puede estar adaptado para derivar el contexto d re la base del diezmado de los coeficientes de frecuencia o es mento anterior cuando el segmento anterior comprende más co ho de banda (es decir, una resolución espectral o de frecuencia consecuencia, las realizaciones pueden proporcionar un r odificar una secuencia de audio codificada para obtener s ficientes que representan muestras de audio decodificadas. Los odificación pueden comprender un paso de derivar un contexto d respondiente a un coeficiente decodificado en este momento o mento actual basándose en un coeficiente antes codificado o a mento anterior, donde el coeficiente antes codificado o anterior re olución de tiempo o frecuencia diferente del coeficiente decod sente momento. Más aún, el método puede comprender un paso entropía el coeficiente actual sobre la base del contexto de codifi uencia de audio codificada. Opcionalmente, el método puede c o de determinar los segmentos de coeficiente de audio codific uencia de audio codificada, donde los segmentos represent eros de coeficientes de audio.
Fig. 3 ilustra la manera en que un procesador 110; 210 pue texto de codificación correspondiente a un segmento actual mentos, es decir, el segmento original anterior 310 que re anteriores coeficientes Sn,o, Sn,i, Sn,2, etc., y, correspondientemente, erior mapeado 320, que tiene una resolución más alta, es decir q yor que Mc,anterior, y representa los coeficientes Mc,nuevos Sn,o( Sn,i, Sn general, se pueden distinguir dos realizaciones, dependien olución del contexto del segmento actual es más alta o más olución del contexto del segmento anterior. La Fig. 3 ilustra una r ual la resolución del segmento anterior de coeficientes MClanteriores esolución del segmento actual de coeficientes Mc,nuevos. La Fig. ficientes del segmento anterior 310 y los símbolos corresp mento anterior mapeado 320. De la Fig. 3, se puede deducir que segmento actual de coeficientes MCinuevos es más alta que la r mento anterior 310 que sólo tiene coeficientes MCfPrecedentes- En u segmento anterior 310 es expandido a un segmento 320 ficientes para que coincida con la resolución de frecuencia o mento actual. Esto puede incluir la expansión pura con me ar en cuenta múltiples segmentos precedentes, es decir, cedentes en los puntos de tiempo n-1 , n-2, etc. En general, las dén tomar en cuenta múltiples ranuras de tiempo o segmentos p número de ranuras de tiempo necesarias para definir un conte de ser diferente en otras implementaciones o realizaciones.
Fig. 4 ilustra otra realización, en la cual los coeficientes de erior 410 son diezmados hasta obtener un segmento 420 u putar los contextos del segmento actual, es decir en la cual ficientes Mc, recedentes del segmento anterior 410 es mayor que ficientes CfnUevos del segmento actual. La Fig. 4 utiliza una ¡lustra de la Fig. 3, por consiguiente se ilustran múltiples coeficien mento 410 y 420. Como se ilustra en la Fig. 4, Mc,anterior es mayo r lo tanto, los coeficientes MClPrecedentes se diezman para que coi olución de frecuencia o espectral del segmento actual de MCinUevos decir que en ciertas realizaciones, se pueden diezmar lo edentes con una resolución mayor para que coincidan con la r Fig. 5 ilustra otra realización, en la cual se lleva a cabo la conm rentes resoluciones. La Fig. 5 ilustra un plano de tiempo/frecuen ilustran tres segmentos subsiguientes de coeficientes de audio, y 530. Cada uno de los segmentos 510, 520 y 530 correspond ie de coeficientes. En la realización ilustrada en la Fig. 5, se pr undo segmento 520 tiene el doble de la longitud del prim mentos 510 y 530. Esto se puede lograr utilizando diferentes mentar en el dominio del tiempo, como se hace, por ejemplo, e lización ilustrada en la Fig. 5, se presume que la velocidad de ntiene constante; en otras palabras, el segundo segmento m prende el doble de coeficientes de audio por ancho de banda qu er segmento 510 o 530.
Fig. 5 demuestra que en este caso la resolución se escala con la inio de la frecuencia o espectral del segmento en el dominio d s palabras, cuanto más corta es la ventana en el dominio del tie la resolución en el dominio de la frecuencia o espectral. Al evaluar acuerdo con una realización, los coeficientes codificados dura mento 510 otorgan una base para determinar el contexto par mento 520, por ejemplo, por medio de una expansión interme bras, se puede obtener el contenido del contexto procedent mento 510 mediante la expansión del primer segmento 510, po inos de interpolación o extrapolación, para derivar el contexto cor egundo segmento 520, que tiene una resolución más alta. o se ilustra en la Fig. 5, al conmutar del segundo segmento mento 530, el elemento constituyente del contexto tiene que cam que la resolución se ha reducido ahora. De acuerdo con una r dén utilizar los coeficientes codificados durante el segundo segm ivar el contexto para el tercer segmento, por medio de un diezmad o se puede llevar a cabo, por ejemplo, en términos de calcular u plemente utilizando sólo un valor por medio u otras medidas para realizaciones otorgan la ventaja de una mayor eficiencia de a reducir aun más la redundancia de un espectro cuantizado en l audio. La codificación espectral sin ruido se puede basar en un mética conjuntamente con una adaptación dinámica del contexto. codificación sin ruido se puede basar en valores espectrales C de utilizar tablas de frecuencia cumulativa dependiente del conte ejemplo, de cuatro tupias adyacentes antes derivadas. La Fig. lización. La Fig. 6 muestra un plano tiempo frecuencia, donde a lo po hay tres ranuras de tiempo indexadas n, n-1 y n-2. Más tra cuatro bandas de frecuencia o espectrales que llevan la desi 1 , m y m+1. La Fig. 6 ilustra el interior de cada recuadro de ranu uencia, que representan tupias de muestras a codificar o de tran tres tipos diferentes de tupias en la Fig. 6, en la cual los r de sombreado o punteado indican las tupias restantes que se ha ecodificar, los recuadros" blancos con un borde pleno indican ificadas o decodificadas y los recuadros grises con borde plen las previamente codificadas/decodificadas que se utilizan para texto. El codificador aritmético puede utilizar entonces tablas ulativas para generar un código binario de longitud variable. mético puede producir un código binario correspondiente a bolos dada y sus respectivas probabilidades. El código bina erar mapeando un intervalo de probabilidades, donde se encuent bolos, contra una palabra en código. El codificador aritrr responder al codificador por entropía 120, o sea el decodificador de las realizaciones precedentemente descriptas. la presente realización, la codificación aritmética basada en el de llevar a cabo sobre la base de 4 tupias (es decir, en c ficientes espectrales) a las que también se designa q(n,m), qu coeficientes espectrales después de la cuantización, que son ady inio de la frecuencia o espectral y que son codificados por e o. De acuerdo con la descripción que antecede, la codificación s abo basándose en el contexto de codificación. Como se indica más de la 4-tuplas, que se está codificando (es decir, el segme za para seleccionar la distribución por probabilidades del codifica ara predecir la amplitud de los coeficientes espectrales. En l uadro 705 representa la determinación del contexto, que se basa ue corresponden a q(n-1 , m), q(n,m-1 ), q (n-1 ,m-1 ) y q (n-1 , recuadros grises con bordes plenos en la Fig. 6. general, en algunas realizaciones el codificador por entropía ptado para codificar el segmento actual en unidades de un ficientes espectrales y para predecir un rango de amplitudes re la base del contexto codificador. la presente realización el esquema de codificación comprende ? primer lugar, se codifica una palabra en código literal utilizando mético y una distribución específica de probabilidades. La palab resenta cuatro coeficientes espectrales adyacentes (a.b.c.d), a uno de a, b, c, d está limitado en el rango: imado y para codificar un resto de la división y el resultado de la di do. lo sucesivo, si el término (a,b,c,d), es decir, cualquier coeficien ede el rango dado en esta realización, esto se puede consider idiendo (a,b,c,d) por un factor (por ejemplo 2 o 4) las veces que s a ajustar la palabra en código así obtenida al rango dado. La di tor de 2 corresponde a un desplazamiento binario hacia la dere ,c,d)» 1. Esta disminución se realiza en una representación po ir que se puede perder información. Los bits menos significat dén perder por el desplazamiento a la derecha, son guardados y los codifica utilizando el codificador aritmético y una di habilidades uniforme. El proceso de desplazamiento a la derec o con respecto a los cuatro coeficientes espectrales (a,b,c,d). las realizaciones generales, el codificador por entropía 120 ptado para codificar el resultado de la división de la 4-tupla utiliza ificar los restos de las divisiones sobre la base de una distribu zando una regla de codificación aritmética. El codificador por de estar adaptado para codificar una secuencia de símbolos y uencia de audio codificada utilizando un alfabeto de símbolos que símbolo de escape y símbolos de grupo que corresponden a ices de grupo disponibles, un alfabeto de símbolos que compren mentos y un alfabeto de símbolos que comprende los diferentes tos. la realización de la Fig. 7a, se puede derivar del contexto la di habilidades para la codificación de la palabra en código literal y imación del número de pasos de reducción de rango. Por ejem abras en código, en un total de 84 = 4096, abarcan un total de 54 sisten en uno o más elementos. La palabra en código resentada en la secuencia de bits en forma de índice de grupo ng grupo ne. Ambos valores pueden ser codificados utilizando mético, utilizando ciertas distribuciones de probabilidades. En una la Fig. 7a, en el paso 710, se presenta la 4-tupla q(n,m), qu ,c,d) o el segmento actual y se da comienzo a un parámetro lev el paso 715 se estima el rango de (a,b,c,d) a partir del contexto. esta estimación, (a,b,c,d) se puede reducir en levO niveles, es d factor de 2lev0. Se. almacenan los planos de bits levO menos signi uso posterior en el paso 750. el paso 720 se verifica si (a,b,c,d) excede el rango dado y, en uce el rango de (a.b.c.d) en un factor 4 en el paso 725. En otras paso 725 (a,b,c,d) se desplazan 2 a la derecha y se almacenan l suprimidos para su uso posterior en el paso 750. ra indicar este paso de reducción, se ajusta ng a 544 en el paso ng = 544 sirve como palabra en código de escape. A continuaci a palabra en clave en la secuencia de bits del paso 755, donde ? n el paso 720 se detecta una coincidencia de rangos, más espe ,c,d) coincide con la condición del rango, se mapea (a,b,c,d) con po ng, y, en caso de ser aplicable, el índice de elemento de g peo es inequívoco, o sea que se puede derivar (a.b.c.d) de tinuación el índice de grupo ng es codificado por un codificad izando una distribución de probabilidades obtenida para ptado/descartado en el paso 735. Seguidamente se inserta el in en la secuencia de bits en el paso 755. En un paso subsiguiente 7 l número de elementos de un grupo es superior a 1. Si es necesar rupo indexado por ng consiste en más de un elemento, el índice grupo ne es codificado por el codificador aritmético en el paso 74 distribución de probabilidades uniforme en la presente realización spués del paso 745, se inserta el índice de elementos de gr uencia de bits en el paso 755. Por último, en el paso 750, se c planos de bits almacenados utilizando el codificador aritmético su tribución de probabilidades uniforme en el paso 755. abra en código y para derivar una 4-tupla de coeficientes es mento actual sobre la base del índice de grupo ng y el índice de a obtener así la representación de dominios espectrales e ficientes espectrales. ciertas realizaciones el decodificador por entropía 220 puede e a decodificar una secuencia de símbolos correspondientes a la io codificada sobre a base de la distribución de probabilidades texto de codificación utilizando un alfabeto de símbolos que c bolo de escape y símbolos de grupo correspondientes a una se grupo disponibles ng, para derivar una 4-tupla preliminar de ectrales sobre la base de un índice de grupo ng disponible al cual símbolo de grupo de la secuencia de Símbolos y sobre la base mento ne y para multiplicar la -tupla preliminar con un factor de ero de símbolos de escape en la secuencia de símbolos para ob coeficientes espectrales. la secuencia de audio codificada, donde un símbolo de escape es po específico ng que sólo se utiliza para indicar una multiplic odificar un resto de una secuencia de audio codificada sobre la ribución uniforme de probabilidades utilizando una regla de mética, el decodificador por entropía 220 puede estar adaptado ar el resto a la 4-tupla multiplicada para obtener el segmento act ontinuación se describe una realización de un esquema de deco ificador aritmético dependiente del contexto USAC. Como corr lización anterior del esquema de codificación, se consideran las responden a coeficientes espectrales cuantizados, que son co o. Más aun, se presume que las 4-tuples se transmiten a partir d frecuencia o espectral más bajo y progresando hasta el c uencia o espectral más elevado. Los coeficientes pueden corre mplo, a coeficientes AAC, que se almacenan en una matriz y se S n de transmisión de las palabras en código sin ruido es ta odifique en el orden recibido y se almacenen en la matriz, bin e undidad de bits, es de bits, es decir el número de planos de b a representar una 4-tupla, por el contexto de la 4-tupla actual culo de la variable denominada levO, que también está indicada e tinuación se divide la 4-tupla por 2lev0, es decir que se supri os de bits y se los guarda para su uso posterior de acuerdo co es descripto. a 4-tupla está en el rango -5<a,b,c,d<4, la profundidad de bits pre o correctamente predicha o sobreestimada. La 4-tupla puede s onces por el índice de grupo ng, el índice de elementos ne y los restantes, en línea con la descripción que antecede. Finaliza ificación de la 4-tupla en curso. La codificación del índice de ele icada en la Fig. 7b por la distribución uniforme de las probabilida lo sucesivo se utiliza siempre para codificar índices de elementos . 7b, el parámetro r representa el resto de la 4-tupla después d ) representa la correspondiente función de densidad de probabilida ev>lev0+2 se codifica otro símbolo de escape de acuerdo con el p . 7b el contexto se reinicia por completo, como cotejando con carta como en el paso 730 de la Fig. 7a, respectivamente, ( guna adaptación del contexto más porque se considera no rele ificación de la 4-tuplá actual. Se utiliza entonces el modelo de p defecto, el que se utilizara cuando no se disponía de ningún cont ros símbolos ng, lo que está indicado por los pasos 774 y 776 uidamente se repite el proceso para otras tupias. ra resumir, la adaptación del contexto es un mecanismo pa nificancia del contexto en la codificación adaptable al contexto. La texto se puede disparar cuando el lev' predicho y el lev real no c fácilmente detectado por el número de símbolos de escap =544), en comparación con 766 y 770 en la Fig. 7b, y por lo men de levar a cabo en el decodificador de manera similar. pk() produce diferentes modelos de distribución de probabilida lización, el 23er bit de t se puede ajustar a uno cuando la 4-tupla espués de haber sido previamente dividida por levO, es decir lev== consecuencia, el mapeo entre el estado del contexto t y e ribución de probabilidades pki es diferente para lev==lev0+ =levO. El mapeo entre el estado del contexto t y el modelo pki ante una fase de ordenamiento realizando optimizaciones en la erales de la secuencia de ordenamiento. Cuando lev>lev0+2, se ero el contexto y t. Get_pk() produce luego el modelo pki de di habilidades por defecto, que corresponde a t=0. ontinuación se describen los detalles de un mapeo de contexto de realización. El mapeo de contexto es la primera operación que s ificación adaptable al contexto después del reinicio eventual ún la presente realización. Esto se realiza en dos pasos. h_map context() v=w=0 si(core_mode==1 ){ q[0][v++]=qs[w++]; } relación= ((flotante)previous_lg)/((flotante)lg); para(j=0; j<lg/4; j++){ k = (int) ((flotante)) ((j)*relación); q[0][v++] = qs[w+k]; } si(core_mode==0){ q[0][lg/4]=qs[previous_lg/4]; } ificación Avanzada de Audio) (core_mode==0) para un coefici ndo se utiliza TCX (Transform based Coding o Codificación nsformadas) (corejriode==1 ). Una de las diferencias proviene de se tratan los límites de las tablas. En AAC, el mapeo puede ini índice 0 (primer valor de la tabla), en tanto que en el caso de T iar desde el índice 1 (segundo valor de la tabla) sabiendo que e mpre e ajusta como "desconocido" (estado específico empleado p texto). La relación de previousjg sobre Ig (Ig anterior sobre Ig) en de la expansión (ratio<1 ) o el diezmado (ratio>1 ), que se sente realización. La Fig. 7c ilustra el caso de TCX cuando se con una tabla de contextos guardada de un tamaño 1024/4, com uierdo 780 de la Fig. 7c, a un tamaño de 512/4, como en el lado la Fig. 7c. Se puede apreciar que, si bien en la tabla de contextos izan incrementos escalonados de 1 , para la tabla de contextos gua izan incrementos escalonados de la relación antes descripta.
Fig. 7c ilustra el procedimiento de actualización de contexto de u he índex of the 4-tuple to decode in the vector*/ (el índice de la 4-odificar en el vector) /*number of 4-tuples*/ (número de 4-tuplas) h_update_context() q[1][1 +i].a=a; q[1][1 +i].b=b; q[1][1+i].c=c; q[1][1+i].d=d; si ( (a<-4) || (a>=4) || (b<-4) || (b>=4) || (c<-4) || (c>=4) || (d<- q[1][1 +i].v =1024; } además q[1][1 +i].v=egrupos[4+a][4+b][4+c][4+d]; si(¡==lg/4 && core_mode==1 ){ qs[0]=q[1][0]; lg/4 && core_mode==0){ qsffl = q[1]M; } previousjg = min(1024,lg); la presente realización, se guarda de una manera diferente de a ificador de núcleo (AAC o TCX). En TCX el contexto se guarda la qsQ de 1024/4 valores. Este mapeo adicional se puede realiza ecisión de bucle cerrado del AMR-WB+ (Adaptive Multirate Wid dec Adaptativo Multivelocidad en Banda Ancha). En la decisi rado se necesitan varios procedimientos de copia de los estados d a analizar cada combinación posible de TCXs y ACELP (Arith ited Linear Prediction (Predicción Lineal de salida por Codificació ucción levO del contexto y se ajusta a variable lev a levO. En el p , el ng de grupo se lee de la secuencia de bits y se deriva de ribución de probabilidades del contexto para la decodificación o 815, se puede decodificar entonces el ng del grupo de la secuen el paso 820 se determina si el ng es igual a 544, que corresp ape. Si es así, se puede incrementar la variable lev en 2 antes o 815. En caso de utilizar esta ramificación por primera vez, =lev0, la distribución de probabilidades, el contexto se pued era correspondiente, descartarlo respectivamente si la ramific za por primera vez en línea con el mecanismo de adaptación eriormente descripto como ocurre en las Figs. 7b y 7c. En el ca ice de grupo ng no es igual a 544 en el paso 820, en un paso sig ermina si el número de elementos de un grupo es mayor que 1 , y aso 830, se lee el elemento del grupo ne y se lo decodifica de la os suponiendo una distribución uniforme, de las probabilidades. ento ne se deriva de la secuencia de bits empleando codificació ribución uniforme de probabilidades. Seguidamente se pueden os de bits a (a,b,c,d) desplazando (a,b,c,d) a la izquierda y agreg bits bp: ((a,b,c,d)«=1 )|=bp. Este proceso se puede repetir lev vec último, en el paso 845 se puede producir la 4-tupla q(n,m), es de continuación se presentan detalles de pseudo códigos y lementación de acuerdo con una realización. Se utilizan l iniciones. ,c,d) 4-tupla a decodificar índice de grupo del plano de a 2 bits más significativo de la 4 0 <= ng <= 544. Este último valor 544 corresponde al símbol ARITH_ESCAPE. índice de elemento dentro de un grupo, ne yace entre 0 y Cardinal del grupo Desplazamiento del grupo oupsQ Mapea el índice del grupo ng con el cardinal de cad (primeros 8 bits) y el desplazamiento del grupo og e (últimos 8 bits). ectorsQ Mapean el desplazamiento del grupo og y elemento ne con el plano de 2 bits más significat tupia (a,b,c,d). h_cf_ng hashn Tabla sombreada que mapea el estado del respecto a un índice de tablas de cumulativas pki. h_cf_ng[pki][545] Modelos de las frecuencias h_cf_r? Frecuencias cumulativas correspondientes al planos de bis menos significativos r ontinuación se considera, en primer lugar, el proceso de deco ifican sin ruido coeficientes espectrales cuantizados por 4— tup smite a partir del coeficiente de frecuencia o espectral más bajo y ta el coeficiente de frecuencia o espectral más alto. Los coeficie guardan en la matriz x_ac__quant[g][win][sfb][bin], y el orden de tr palabras en código de la codificación sin ruido es tal que c odifica en el orden recibido y guardado en la matriz, bin es el í rementa más rápidamente y g es el índice con incremento más len palabra en código, el orden de decodificación es a, b, c, d. El c X se guarda directamente en la matriz x_tcx_invquant[win][bin], y smisión de las palabras en código de la codificación sin ruid ndo se las decodifica en el orden recibido y guardado en la ma ice que se incrementa más rápidamente y win es el índice que s s lentamente. Dentro de una palabra en código el orden de decodi h_re set_co ntext( ) para(i=0;i<258;i++){ qs[i].a=0; qs[i].b=0; qs[i].c=0; qs[i].d=0 qs[i].v— 1 ; } para(i=0;i<290;i++){ q[0][i].a=0; q[0][i].b=0; q[0][i].c=0; q[0][i].d= q[0][i].v=-1 ; q[1][i]-a=0; q[1][i].b=0; q[1][i].c=0; q[1][i].d= q[1][i].v=-1 ; } previousJg=256; lo contrario, cuando la bandera arith_reset_flag es FALSE (FALS mapeo entre el contexto anterior y el contexto actual: riable de entrada*/ relación= ((fIotante)previous_lg)/((flotante)lg); para(j=0; j<lg; j++){ k = (int) ((flotante)) (G)*relación); q[0][v++] = qs[w+k]; } si(core_mode==0){ q[0][lg]=qs[previous_lg]; } q[0][lg+1]=qs[previous_lg+1]; previous_lg=lg; } decodificador sin ruido produce una salida de 4-tuplas de ectrales cuantizados identificados . Al principio se calcula e texto basándose en los cuatro grupos decodificados anteriorment 4-tupla que se ha de decodificar. El estado del contexto está ción arith_get_context(): T3=q[0][1+i+1].v+1 ; si ( (tO<10) && (t1<10) && (t2<10) && (t3<10) ){ si ( t2>1 ) t2=2; si ( t3>1 ) t3=2; retorno 3*(3*(3*(3*(3*(10*(10*t0+t1 ))+t2)+t3))); } si ( (t0<34) && (t1<34) && (t2<34) && (t3<34) ){ si ( (t2>1 ) && (t2<10) ) t2=2; además si ( t2>=10 ) t2=3; si ( (t3>1 ) && (t3<10) ) t3=2; además si ( t3>=10 ) t3=3; retorno 252000+4*(4*(34*(34*t0+t1 ))+t2)+t3; } si ( (t0<90) && (t1<90) ) retorno 880864+90*(90*t0+t1); sí ( (t0<544) && (t1<544) ) retorno 1609864 + 544*t0+t1 ; si ( t0>1 ) a1=q[1][i-1].a; b1=q[1][i-1].b; c1=q[1][i-1].c; d1=q[1][i-1].d; b1=d=d1=0; aO»=1 bO»=1 cO»=1 dO»=1 a1»= 1; (aK-4) II (a1 >=4) || (bK-4) || (b1 >=4) || (d<-4) || (d 4) || (d1 >=4) ); si ( tO>1 ) t0=1 +(egroups[4+a0][4+b0][4+c0][4+d0] » 16); si ( t1 >1 ) t1 =1 +(egroups[4+a1][4+b1][4+c1][4+d1] » 16); retorno 1609864 + ((I«24)|(544*t0+t1 )); a vez conocido el estado, se decodifica el grupo al cual pertenece más significativo de la 4-tupla utilizando la arith__decode() alim ía de frecuencias cumulativas apropiadas correspondiente al texto. La correspondencia se realiza mediante la función arith_get ariable de entrada */ Estado del contexto*/ h_get_pk(s) j=ar¡ h_cf_nq_hash[¡&32767]; si ( j==OxFFFFFFFFul ) corte; si ( 0>>8)==s ) retorno j&255; } p=psci+7*(s»22); j= s & 4194303; si ( j<436961 ) { si ( j<252001 ) retorno p[(j<243001 )? retorno p[(j<288993)?2:3]; } además { si ( j<1609865 ) retorno p[(j<880865)? nciones auxiliares */ l arith_first_símbolo(nulo); /* Retorno VERDADERO si es el primer símbolo de la secuen no lo es */ ort arith_get_next_bit(nulo); /* Adquirir el siguiente bit de la secuencia de bits */ ariables globales 7 r ariables de entrada */ JreqQ; h_decode() bajo=0; alto=1048575; } rango = alto-bajo+1; cum =((((¡nt64) (valor-bajo+1))«16H(int64) 1))/((¡nt64) rango) p = cum_freq-1 ; do { s q=p+(cfl»1); si ( *q > cum ) { p=q; cfl++; } cfl»=1; } en tanto que ( cfl>1 ); símbolo = p-cum_freq+1; además si ( bajo>=524286) { valor -=524286; bajo -=524286; alto -=524286; } además si ( bajo>=262143 && alto<786429) { valor— 262143; bajo -= 262143; alto -= 262143; } además, corte; bajo += bajo; alto += alto+1 ; valor = (valor«1 ) | arith_get_next_bit(); =dgroups[nq]&255 = dgroups[nq]»8 índice del elemento ne se decodifica a continuación evocando a la tabla de frecuencias cumulativas (arith_cf_ne+((mm*(mm-1 decodificado el índice de elemento se puede derivar el plano de ificativo de la 4-tupla con la tabla dgvector[]: gvectors[4*(og+ne)] gvectors[4*(og+ne)+1 ] gvectors[4*(og+ne)+2] gvectors[4*(og+ne)+3] ontinuación se decodifica el resto de los planos de bits desde ificativo hasta el nivel menos significativo evocando lev veces a la tabla de frecuencias cumulativas arith_cf_r Q. El plano de bit mite refinar la 4-tupla decodificada de la siguiente manera: (a«1 ) | (r&1 ) q[1][1+i].a=a; q[1][1+i].b=b; q[1][1+¡].c=c; q[1][1 +i].d=d; si ( (a<-4) || (a>=4) || (b<-4) || (b>=4) || (c<-4) || (c>=4) <-4) || (d>=4) ) q[1][1 +i].v =1024; además q[1][1+¡].v=egroups[4+a][4+b][4+c][4+d]; si(¡==lg && core_mode==1 ){ qs[0]=q[1] [0]; relación= ((flotante) lg)/((flotanté)256); para(j=0; j<256; j++){ k = (¡nt) ((flotante)) ((j)*relación); qs[1 +k] = q[1][1 +j] ; previous_lg=min(1024,lg); } pendiendo de ciertos requisitos de implementación de los m sente invención, se pueden implementar los métodos de la dware o software. La implementación se puede formar utilizando acenamiento digital, en especial un disco, un DVD o un CD, c trol legible de manera electrónica almacenado en el mismo, que c putadora programable de tal manera que se puedan ejecutar lo presente invención. En general, por lo tanto, la presente inv ducto programa de computación con un código de programa par ible por la máquina, donde el código de programa es operativo par todos de la presente invención cuando el programa de computaci una computadora. En otras palabras, los métodos de la prese sisten en un programa de computación que tienen un código de p cutar por lo menos uno de los métodos de la presente invenci

Claims (1)

  1. REIVINDICACIONES Un codificador de audio (100) para codificar segmentos de segmentos de coeficientes que representan diferentes res tiempo o frecuencia de una señal de audio muestread codificador de audio (100) comprende un procesador (110) para derivar un contexto de correspondiente a un coeficiente actualmente codificado de actual sobre la base de un coeficiente ya codificado de anterior, donde el coeficiente antes codificado representa u diferente de tiempo o frecuencia que el coeficiente que se est en el momento y un codificador por entropía (120) para codificar por entropía actual sobre la base del contexto de codificación para secuencia de audio codificada. El codificador de audio (100) de acuerdo con la reivindicación el codificador por entropía (120) está adaptado para codificar actual en unidades de una tupia de coeficientes espectrales y un rango de la tupia sobre la base del contexto de codificación. El codificador de audio (100) de acuerdo con la reivindicación el codificador por entropía (120) está adaptado para dividir la factor predeterminado tantas veces como sea necesario pa resultado de la división a un rango predeterminado y para número de divisiones necesario, un resto de la división y el r división cuando la tupia no yace en el rango estimado y par otra manera un resto de la división y el resultado de la división. El codificador de audio (100) de acuerdo con la reivindicación el codificador por entropía (120) está adaptado para codifica de la división o la tupia utilizando un índice de grupo, donde ín se refiere a un grupo de una o más palabras en código con r distribución uniforme de probabilidades utilizando una regla d aritmética. El codificador de audio (100) de acuerdo con la reivindicación el codificador por entropía (120) está adaptado para codificar u de símbolos en la secuencia de audio codificada utilizando u símbolos que comprende el símbolo de escape y símbolos corresponden a una serie de índices de grupos disponible alfabeto de símbolos comprende los índices de elementos corr y un alfabeto de símbolos que comprende los diferentes v restos. El codificador de audio ( 00) de acuerdo con una de las reivind 6, en el cual el procesador (110) y el codificador por entropí configurados para operar sobre la base de un diezmado de lo espectrales del segmento anterior, cuando el segmento anteri resolución espectral más fina que el segmento actual derivar un contexto de codificación correspondiente a un coefi está codificando en este momento de un segmento actual sob un coeficiente previamente codificado de un segmento anter coeficiente previamente codificado representa una resolución frecuencia diferente de la del coeficiente que se está codificand codificar por entropía el coeficiente actual sobre la base del codificación para obtener una secuencia de audio codificada. Un decodificador de audio (200) para decodificar una secue codificada a fin de obtener segmentos de coeficientes que diferentes resoluciones de tiempo o frecuencia de una se tomada como muestra, que comprende un procesador (210) para derivar un contexto de codifica coeficiente que se está decodificando en el de un segmento a El decodificador de áudio (200) de acuerdo con la reivindica cual el procesador (210) está adaptado para derivar el codificación sobre la base del coeficiente anterior, donde los forman una representación espectral de una señal de audio por la secuencia de audio en una resolución espectral que v segmentos. El decodificador de audio (200) de acuerdo con una de las rei 9 a 10, donde el procesador está adaptado para derivar el codificación por banda espectral correspondiente al coefic sobre la base de coeficientes espectrales adyacentes ya dec el segmento anterior y opcionalmente en el presente segmento El decodificador de audio (200) de acuerdo con la reivindica cual el decodificador por entropía (220) está adaptado para d índice de grupo de la secuencia de audio codificada sobre la distribución de probabilidades derivada del contexto de codific El decodificador de audio (200) de acuerdo con la reivindicac cual el decodificador por entropía (220) está adaptado para de secuencia de símbolos de la secuencia de audio codificada s de la distribución de probabilidades derivada del contexto d utilizando un alfabeto de símbolos que comprende un símbolo símbolos de grupo que corresponden a una serie de índic disponibles, para derivar una tupia de preliminar de coeficiente sobre la base de un índice de grupo disponible al cual co símbolo de grupo de la secuencia de símbolos y basado en elemento y para multiplicar la tupia prelimitar por un factor que número de símbolos de escape en la secuencia de símbolos p tupia de coeficientes espectrales. El decodificador de audio (200) de acuerdo con la reivindica cual el decodificador por entropía (220) está adaptado para resto de una división de la secuencia de audio codificada sob exhibe una resolución espectral más fina que e! segmento act el procesador (210) y el codificador por entropía (220) están para operar sobre la base de una expansión de los coeficiente del segmento anterior, cuando el segmento anterior exhibe u espectral más gruesa que el segmento actual. Un método para decodificar una secuencia de audio codific obtener segmentos de coeficientes que representan muestr decodificadas, que comprende los siguientes pasos derivar un contexto de codificación para un coeficiente decodificando de un segmento actual sobre la base de un coe decodificado de un segmento anterior, donde el coefi decodificado representa una resolución diferente de tiempo que el coeficiente que se está decodificando en el momento; y decodificar por entropía el coeficiente actual sobre la base de
MX2011000379A 2008-07-11 2009-05-18 Codificador de audio y decodificador de audio. MX2011000379A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7984208P 2008-07-11 2008-07-11
US10382008P 2008-10-08 2008-10-08
PCT/EP2009/003521 WO2010003479A1 (en) 2008-07-11 2009-05-18 Audio encoder and audio decoder

Publications (1)

Publication Number Publication Date
MX2011000379A true MX2011000379A (es) 2011-02-25

Family

ID=40886050

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011000379A MX2011000379A (es) 2008-07-11 2009-05-18 Codificador de audio y decodificador de audio.

Country Status (22)

Country Link
US (6) US8930202B2 (es)
EP (10) EP3300076B1 (es)
JP (1) JP5606433B2 (es)
KR (1) KR101456641B1 (es)
CN (1) CN102089813B (es)
AR (1) AR072422A1 (es)
AU (1) AU2009267543B2 (es)
BR (4) BR122021007875B1 (es)
CA (1) CA2729925C (es)
CO (1) CO6351831A2 (es)
DK (1) DK3573056T3 (es)
ES (3) ES2651437T3 (es)
FI (1) FI3573056T3 (es)
HK (1) HK1253032A1 (es)
MX (1) MX2011000379A (es)
MY (1) MY160260A (es)
PL (3) PL2301019T3 (es)
PT (3) PT3573056T (es)
RU (1) RU2487427C2 (es)
TW (1) TWI449033B (es)
WO (1) WO2010003479A1 (es)
ZA (1) ZA201009258B (es)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
CN102089816B (zh) 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
EP3300076B1 (en) * 2008-07-11 2019-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
KR101411780B1 (ko) 2009-10-20 2014-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 이전의 디코딩된 스펙트럼 값들의 그룹의 검출을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
JP5773502B2 (ja) * 2010-01-12 2015-09-02 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
ES2458354T3 (es) 2010-03-10 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, codificador de señales de audio, métodos y programa de ordenador que utiliza tasa de muestreo dependiente de la codificación del contorno de distorsión en el tiempo
EP2596494B1 (en) 2010-07-20 2020-08-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Audio decoder, audio decoding method and computer program
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
TWI451746B (zh) * 2011-11-04 2014-09-01 Quanta Comp Inc 視訊會議系統及視訊會議方法
CN112185399A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
JP6434411B2 (ja) * 2012-09-24 2018-12-05 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
KR20140089871A (ko) 2013-01-07 2014-07-16 삼성전자주식회사 대화형 서버, 그 제어 방법 및 대화형 시스템
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
PL3008726T3 (pl) 2013-06-10 2018-01-31 Fraunhofer Ges Forschung Urządzenie i sposób kodowania obwiedni sygnału audio, przetwarzania i dekodowania przez modelowanie reprezentacji sumy skumulowanej z zastosowaniem kwantyzacji i kodowania rozkładu
ES2635026T3 (es) * 2013-06-10 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2559199A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5253055A (en) * 1992-07-02 1993-10-12 At&T Bell Laboratories Efficient frequency scalable video encoding with coefficient selection
US5710562A (en) 1995-08-31 1998-01-20 Ricoh Company Ltd. Method and apparatus for compressing arbitrary data
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
US6931291B1 (en) * 1997-05-08 2005-08-16 Stmicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
IL129345A (en) * 1999-04-06 2004-05-12 Broadcom Corp Video encoding and video/audio/data multiplexing device
KR100871999B1 (ko) 2001-05-08 2008-12-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
ES2334934T3 (es) * 2002-09-04 2010-03-17 Microsoft Corporation Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel.
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
WO2004057892A1 (en) 2002-12-20 2004-07-08 Nokia Corporation Method and device for organizing user provided information with meta-information
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US7343291B2 (en) * 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7509161B2 (en) * 2003-10-22 2009-03-24 Instrumentarium Corporation Method and apparatus for determining the cerebral state of a patient using generalized spectral entropy of the EEG signal
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
US20050185541A1 (en) 2004-02-23 2005-08-25 Darren Neuman Method and system for memory usage in real-time audio systems
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
TWI246256B (en) * 2004-07-02 2005-12-21 Univ Nat Central Apparatus for audio compression using mixed wavelet packets and discrete cosine transformation
WO2006006936A1 (en) * 2004-07-14 2006-01-19 Agency For Science, Technology And Research Context-based encoding and decoding of signals
BRPI0514940A (pt) * 2004-09-06 2008-07-01 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável e método de codificação escalável
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
US7428342B2 (en) * 2004-12-17 2008-09-23 Microsoft Corporation Reversible overlap operator for efficient lossless data compression
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US7788106B2 (en) * 2005-04-13 2010-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Entropy coding with compact codebooks
US7196641B2 (en) * 2005-04-26 2007-03-27 Gen Dow Huang System and method for audio data compression and decompression using discrete wavelet transform (DWT)
US8032240B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US20070036228A1 (en) * 2005-08-12 2007-02-15 Via Technologies Inc. Method and apparatus for audio encoding and decoding
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
BRPI0707969B1 (pt) * 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
KR101244310B1 (ko) * 2006-06-21 2013-03-18 삼성전자주식회사 광대역 부호화 및 복호화 방법 및 장치
KR101346358B1 (ko) * 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US20080097757A1 (en) * 2006-10-24 2008-04-24 Nokia Corporation Audio coding
EP2120461B1 (en) * 2007-03-14 2011-07-06 Nippon Telegraph and Telephone Corporation Code quantity estimating method and device, their program, and recording medium
US20080294446A1 (en) 2007-05-22 2008-11-27 Linfeng Guo Layer based scalable multimedia datastream compression
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP3300076B1 (en) 2008-07-11 2019-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
US8660176B2 (en) * 2008-09-26 2014-02-25 Qualcomm Incorporated Resolving geometric relationships among video data units
KR101411780B1 (ko) * 2009-10-20 2014-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 이전의 디코딩된 스펙트럼 값들의 그룹의 검출을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
JP5773502B2 (ja) * 2010-01-12 2015-09-02 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム
JP6385433B2 (ja) * 2013-10-18 2018-09-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号のスペクトルのスペクトル係数のコード化

Also Published As

Publication number Publication date
EP3937167A1 (en) 2022-01-12
EP2301019A1 (en) 2011-03-30
US20230260524A1 (en) 2023-08-17
EP3937167B1 (en) 2023-05-10
EP4376307A2 (en) 2024-05-29
PT3300076T (pt) 2019-07-17
US20190189136A1 (en) 2019-06-20
ES2651437T3 (es) 2018-01-26
WO2010003479A1 (en) 2010-01-14
US11942101B2 (en) 2024-03-26
EP4376305A2 (en) 2024-05-29
EP4224471A3 (en) 2023-09-06
PT3573056T (pt) 2022-10-24
EP3300076A1 (en) 2018-03-28
ES2731424T3 (es) 2019-11-15
CN102089813A (zh) 2011-06-08
US11670310B2 (en) 2023-06-06
CA2729925C (en) 2016-03-29
EP4369609A3 (en) 2024-05-22
JP2011527443A (ja) 2011-10-27
PL3300076T3 (pl) 2019-11-29
US20230326470A1 (en) 2023-10-12
EP4369609A2 (en) 2024-05-15
BR122021007798B1 (pt) 2021-10-26
US10242681B2 (en) 2019-03-26
KR101456641B1 (ko) 2014-11-04
EP2301019B1 (en) 2017-10-04
RU2487427C2 (ru) 2013-07-10
BR122021008239B1 (pt) 2022-03-03
EP4376306A2 (en) 2024-05-29
FI3573056T3 (fi) 2022-11-30
RU2011102424A (ru) 2012-07-27
ZA201009258B (en) 2011-11-30
MY160260A (en) 2017-02-28
CN102089813B (zh) 2013-11-20
DK3573056T3 (da) 2022-10-03
BR122021007875B1 (pt) 2022-02-22
EP4224471A2 (en) 2023-08-09
US20150194160A1 (en) 2015-07-09
EP3300076B1 (en) 2019-04-24
PL2301019T3 (pl) 2018-04-30
PL3573056T3 (pl) 2022-12-19
US10685659B2 (en) 2020-06-16
AR072422A1 (es) 2010-08-25
US20110173007A1 (en) 2011-07-14
PT2301019T (pt) 2017-12-26
BRPI0910796A2 (pt) 2020-11-03
KR20110040822A (ko) 2011-04-20
EP3573056B1 (en) 2022-08-17
CO6351831A2 (es) 2011-12-20
JP5606433B2 (ja) 2014-10-15
EP4224472A1 (en) 2023-08-09
EP3573056A1 (en) 2019-11-27
HK1253032A1 (zh) 2019-06-06
BRPI0910796B1 (pt) 2021-07-13
TW201007698A (en) 2010-02-16
CA2729925A1 (en) 2010-01-14
US8930202B2 (en) 2015-01-06
TWI449033B (zh) 2014-08-11
ES2934052T3 (es) 2023-02-16
US20200294515A1 (en) 2020-09-17
AU2009267543B2 (en) 2013-01-31
AU2009267543A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
MX2011000379A (es) Codificador de audio y decodificador de audio.
RU2326450C2 (ru) Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью
EP3693964B1 (en) Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
EP1527441A2 (en) Audio coding
ES2951482T3 (es) Codificador de audio y decodificador de audio

Legal Events

Date Code Title Description
FG Grant or registration