ES2655046T3 - Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio - Google Patents

Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Download PDF

Info

Publication number
ES2655046T3
ES2655046T3 ES14783660.5T ES14783660T ES2655046T3 ES 2655046 T3 ES2655046 T3 ES 2655046T3 ES 14783660 T ES14783660 T ES 14783660T ES 2655046 T3 ES2655046 T3 ES 2655046T3
Authority
ES
Spain
Prior art keywords
matrix
input
down mix
mix matrix
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14783660.5T
Other languages
English (en)
Inventor
Florin Ghido
Achim Kuntz
Bernhard Grill
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2655046T3 publication Critical patent/ES2655046T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Un procedimiento para decodificar una matriz de mezcla descendente (306) para mapear una pluralidad de canales de entrada (300) de contenido de audio con una pluralidad de canales de salida (302), en el que los canales de entrada y salida (300, 302) están asociados a respectivos altavoces en posiciones predeterminadas con respecto a la posición de un oyente, en la que la matriz de mezcla descendente (306) es codificada mediante el aprovechamiento de la simetría de los pares de altavoces (S1-S9) de la pluralidad de canales de entrada (300) y la simetría de los pares de altavoces (S10-S11) de la pluralidad de canales de salida (302), comprendiendo el procedimiento: recibir información codificada que representa la matriz de mezcla descendente codificada (306) de un codificador y decodificar la información codificada para obtener la matriz de mezcla descendente decodificada (306), en el cual los respectivos pares (S1-S11) de canales de entrada y salida (300, 302) de la matriz de mezcla descendente (306) tienen asociadas respectivas ganancias de mezcla para adaptar un nivel en el cual un canal de entrada dado (300) contribuye a un canal de salida dado (302) y en el que el procedimiento comprende además: la decodificación de la información que representa los valores de significancia de la matriz de mezcla descendente codificada (306), en la que los respectivos valores de significancia son asignados a pares (S1-S11) de grupos simétricos de altavoces de los canales de entrada (300) y grupos de altavoces simétricos de los canales de salida (302), indicando el valor de significancia si una ganancia de mezcla para uno o más de los canales de entrada (300) es cero o no y la decodificación a partir de la información que representa la matriz de mezcla descendente (306) las ganancias de mezcla codificadas.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
imagen7
imagen8
imagen9
imagen10
imagen11
[0055] Ahora se puede codificar esta lista, por ejemplo, utilizando también la codificación limitada de Golomb-Rice. En comparación con la realización descrita con respecto a la Fig. 6, se puede ver que se puede codificar esta 5 lista de manera aun más eficaz. En el mejor de los casos, cuando la matriz compacta es idéntica a la matriz plantilla, la totalidad del vector consiste sólo en ceros y sólo se debe codificar un número de longitudes de ejecución.
[0056] En lo que respecta al uso de una matriz plantilla, como se describiera con respecto a la Fig. 7, cabe señalar que tanto el codificador como el decodificador tienen que tener una serie predeterminada de dichas plantillas
10 compactas, lo que se determina de forma individual mediante una serie de altavoces de entrada y salida, a diferencia de una configuración de entrada o salida que está determinada por la lista de altavoces. Esto significa que el orden de los altavoces de entrada y salida no es relevante para determinar la matriz plantilla, sino que puede ser permutado antes de usarse para equipararse al orden de una matriz compacta dada.
15 [0057] En lo sucesivo, como ya se ha mencionado anteriormente, se pasa a describir realizaciones con respecto a la codificación de las ganancias de mezcla proporcionadas en la matriz de mezcla descendente original que ya no están presentes en la matriz de mezcla compacta y que también deben ser codificadas y transmitidas.
[0058] La Fig. 8 describe una realización para codificar las ganancias de mezcla. Esta realización hace uso
20 de las propiedades de las sub-matrices que corresponden a dichas una o más entradas no cero de la matriz de mezcla descendente original, de acuerdo con diferentes combinaciones de grupos de altavoces de entrada y salida, es decir los grupos S (simétricos, L y R), C (central) y A (asimétricos). La Fig. 8 describe sub-matrices posibles que se pueden derivar de la matriz de mezcla descendente mostrada en la Fig. 4, de acuerdo con diferentes combinaciones de altavoces de entrada y salida, a saber, los altavoces simétricos L y R, los canales centrales C y
25 los altavoces asimétricos A. En la Fig. 8, las letras a, b, c y d representan valores de ganancia arbitrarios.
[0059] La Fig. 8A ilustra cuatro sub-matrices posibles que se pueden derivar de la matriz de la Fig. 4. La primera es la sub-matriz que define el mapeo de dos canales centrales, por ejemplo los altavoces C en la configuración de entrada 300 y el altavoz C en la configuración de salida 302, y el valor de ganancia “a” es el valor 30 de ganancia indicado en el elemento de la matriz [1,1] (elemento de superior izquierdo de la Fig. 4). La segunda submatriz de la Fig. 8A representa, por ejemplo, el mapeo de dos canales de entrada simétricos, por ejemplo los canales de entrada Lc y Rc, con un altavoz central, tal como el altavoz C, en la configuración de los canales de salida. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [1,2] y [1,3]. La tercera sub-matriz de la Fig. 8A se refiere al mapeo de un altavoz central C, tal como el altavoz Cvr de la 35 configuración de entrada 300 de la Fig. 4, con dos canales simétricos tales como los canales Ls y Rs, de la configuración de salida 302. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [4,21] y [5,21]. La cuarta sub-matriz de la Fig. 8A representa un caso en que se mapean dos canales simétricos, por ejemplo los canales L, R de la configuración de entrada 300 se mapean con los canales L, R de la configuración de salida 302. Los valores de ganancia “a” a “d” son los valores de ganancia indicados en los
40 elementos de matriz [2,4], [2,5], [3,4] y [3,5].
[0060] La Fig. 8B ilustra las sub-matrices cuando se mapean altavoces asimétricos. La primera representación es una sub-matriz que se obtiene al mapear dos altavoces asimétricos (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4). La segunda sub-matriz de la Fig. 8B se refiere al mapeo de dos
45 canales de entrada simétricos con un canal de salida asimétrico que, en la realización de la Fig. 4 es, por ejemplo, el mapeo de los dos canales de entrada simétricos LFE y LFE2 con el canal de salida LFE. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [6,11] y [6,12]. La terceras sub-matrices de la Fig. 8B representa el caso en que se corresponde un altavoz asimétrico de entrada con un par de altavoces de salida simétrico. En el caso del ejemplo no hay ningún altavoz de entrada asimétrico.
50 [0061] La Fig. 8C ilustra dos sub-matrices para el mapeo de los canales centrales con altavoces asimétricos. La primera sub-matriz mapea un altavoz central de entrada a un altavoz asimétrico de salida (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4), y la segunda sub-matriz mapea un altavoz de entrada asimétrico con un altavoz central de salida.
55 [0062] De acuerdo con esta realización, por cada grupo de altavoces de salida, se verifica si la columna
12
imagen12
detenerse aquí si el nivel de precisión es 0,5 dB; -sumar el resto de los enteros múltiplos de 0,25 dB, descendiendo de 0 dB a minGain y sumar el resto de los enteros múltiplos de 0,25 dB, ascendiendo de 0,25 dB a maxGain.
5 [0067] Por ejemplo, cuando maxGain es 2 dB y minGain es -6 dB y la precisión es 0,5 dB, se genera la siguiente lista:
0, -3, -6, -1, -2, -4, -5, 1, 2, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5, 0,5, 1,5.
10 [0068] En lo que respecta a la realización anterior, cabe señalar que la invención no se limita a los valores anteriormente indicados; por el contrario, en lugar de utilizar enteros múltiplos de 3dB y a partir de 0dB, se pueden seleccionar otros valores y también se pueden seleccionar otros valores del nivel de precisión, dependiendo de las circunstancias.
15 [0069] En general, la lista de valores de ganancia se puede generar de la siguiente manera:
-sumar enteros múltiplos de un primer valor de ganancia, entre la ganancia mínima, inclusive, y un valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer valor de ganancia, entre el valor de ganancia inicial, inclusive, y la
20 ganancia máxima, inclusive, en orden creciente; -sumar el resto de los enteros múltiplos de un primer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
25 -detenerse aquí si el nivel de precisión es el primer nivel de precisión; -sumar el resto de los enteros múltiplos de un segundo nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del segundo nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
30 -detenerse aquí si el nivel de precisión es el segundo nivel de precisión; -sumar el resto de los enteros múltiplos de un tercer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente y -sumar el resto de los enteros múltiplos del tercer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente.
35 [0070] En la realización anterior, cuando el valor de ganancia inicial es cero, las partes que suman los valores restantes en orden creciente y que satisfacen la condición de multiplicidad asociada suman inicialmente el primer valor de ganancia o el primero, segundo o tercer nivel de precisión. Sin embargo, en la generalidad de los casos, las partes que suman los valores restantes en orden creciente suman inicialmente el menor valor, satisfaciendo la
40 condición de multiplicidad asociada, en el intervalo entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive. De manera correspondiente, las partes que suman los valores restantes en orden decreciente suman inicialmente el valor más grande, satisfaciendo la condición de multiplicidad asociada, en el intervalo entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive.
45 [0071] Considerando un ejemplo similar al anterior pero con un valor de ganancia inicial = 1dB (un primer valor de ganancia = 3dB, maxGain = 2dB, minGain = -6dB y un nivel de precisión = 0,5dB) da lo siguiente:
Descendente: 0, -3, -6 Ascendente: [vacío]
50 Descendente: 1, -2, -4, -5 Ascendente: 2 Descendente: 0,5, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5 Ascendente: 1,5
55 [0072] Para codificar un valor de ganancia, preferentemente se busca la ganancia en la tabla y se emite su posición dentro de la tabla. Siempre se encuentra la ganancia deseada, puesto que todas las ganancias son previamente cuantificadas al número entero más cercano múltiplo de la precisión estipulada de, por ejemplo, 1dB, 0,5dB o 0,25dB. De acuerdo con una realización preferida, las posiciones de los valores de ganancia tienen un índice asociado que indica la posición en la tabla y los índices de las ganancias pueden ser codificados, por ejemplo,
14
imagen13
matriz de mezcla descendente está indicado en el flujo de bits como un valor de ganancia máxima maxGain y un valor de ganancia mínima minGain; por lo tanto no se desperdician bits en valores que no se utilizan en realidad y a la vez no se limita la flexibilidad.
5 [0077] Suponiendo que se dispone de una lista de canales de entrada y también de una lista de canales de salida que aportan información geométrica sobre cada altavoz, como por ejemplo los ángulos azimutal y de elevación y, opcionalmente, el nombre convencional del altavoz, por ejemplo de acuerdo con las referencias de la técnica anterior [6] o [7], un algoritmo para codificar una matriz de mezcla descendente, de acuerdo con las realizaciones puede ser el mostrado a continuación en la tabla 1:
10 Tabla 1 -Sintaxis de DownmixMatrix
Sintaxis
No. de bits Mnemónico
DownmixMatrix(inputConfig, inputCount, outputConfig, outputCount) {
equalizerPresent; if (equalizerPresent) { EqualizerConfig(inputConfig, inputCount); }
1 uimsbf
precisionLevel; maxGain = escapedValue(3, 4, 0); minGain = escapedValue(4, 5, 0) + 1; ConvertToCompactConfig(inputConfig, inputCount); ConvertToCompactConfig(outputConfig, outputCount);
2 uimsbf
isAllSeparable; if (!isAllSeparable) { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) {
1 uimsbf
isSeparable[i]; } } } else { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) { isSeparable[i] = 1; } } }
1 uimsbf
isAllSymmetric; if (!isAllSymmetric) { for (i = 0; i < compactOutputCount; i++) {
1 uimsbf
isSymmetric[i]; } } else { for (i = 0; i < compactOutputCount; i++) { isSymmetric[i] = 1; }
1 uimsbf
mixLFEOnlyToLFE;
1 uimsbf
rawCodingCompactMatrix; if (rawCodingCompactMatrix) { for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (!mixLFEOnlyToLFE || (compactInputConfig[i].isLFE == compactOutputConfig[j].isLFE)) {
1 uimsbf
compactDownmixMatrix[i][j];
1 uimsbf
16
} else { compactDownmixMatrix[i][j] = 0; } } } } else { if (mixLFEOnlyToLFE) { compactInputLFECount = 0; compactOutputLFECount = 0; for (i = 0; i < compactInputCount; i++) { if (compactInputConfig[i].isLFE) compactInputLFECount++; } for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].isLFE) compactOutputLFECount++; } totalCount = (compactInputCount -compactInputLFECount) * (compactOutputCount -compactOutputLFECount); } else { totalCount = compactInputCount * compactOutputCount; } useCompactTemplate; n = 3; if (totalCount >= 256) n = 4; runLGRParam; count = 0; flatCompactMatrix[totalCount + 1]; while (count < totalCount) { zeroRunLength; /* limited Golomb-Rice using runLGRparam */ flatCompactMatrix[count .. count + zeroRunLength] = {0, ..., 0, 1}; count += zeroRunLength + 1; } count = 0; for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (mixLFEOnlyToLFE && compactInputConfig[i].isLFE && compactOutputConfig[j].isLFE) { compactDownmixMatrix[i][j]; } else if (mixLFEOnlyToLFE && (compactInputConfig[i].isLFE ^ compactOutputConfig[j].isLFE)) { compactDownmixMatrix[i][j] = 0; } else { compactDownmixMatrix[i][j] = flatCompactMatrix[count++]; } } } if (useCompactTemplate) { compactTemplate = FindCompactTemplate(inputConfig, inputCount, outputConfig, outputCount); for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { compactDownmixMatrix[i][j] ^= compactTemplate[i][j]; } } } } fullForAsymmetricInputs;
1 n varía 1 1 1 uimsbf uimsbf bslbf uimsbf uimsbf uimsbf
17
rawCodingNonzeros; if (!rawCodingNonzeros) { gainLGRParam; generateGainTable(maxGain, minGain, precisionLevel); } for (i = 0; i < compactInputCount; i++) { iType = compactInputConfig[i].pairType; for (j = 0; j < compactOutputCount; j++) { oType = compactOutputConfig[j].pairType; i1 = compactInputConfig[i].originalPosition; o1 = compactOutputConfig[j].originalPosition; if ((iType != SYMMETRIC) && (oType != SYMMETRIC)) { downmixMatrix[i1][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); } else if (iType != SYMMETRIC) { o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); useFull = (iType == ASYMMETRIC) && fullForAsymmetricInputs; if (isSymmetric[j] && !useFull) { downmixMatrix[i1][o2] = downmixMatrix[i1][o1]; } else { downmixMatrix[i1][o2] = DecodeGainValue(); } } else if (oType != SYMMETRIC) { i2 = compactInputConfig[i].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i2][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSymmetric[j]) { downmixMatrix[i2][o1] = downmixMatrix[i1][o1]; } else { downmixMatrix[i2][o1] = DecodeGainValue(); } } else { i2 = compactInputConfig[i].SymmetricPair.originalPosition; o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; downmixMatrix[i2][o1] = 0.0; downmixMatrix[i2][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSeparable[j] && isSymmetric[j]) { downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (!isSeparable[j] && isSymmetric[j]) { downmixMatrix[i1][o2] = DecodeGainValue(); downmixMatrix[i2][o1] = downmixMatrix[i1][o2]; downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (isSeparable[j] && !isSymmetric[j]) {
3 uimsbf
18
imagen14
}
eqExtendedRange; for (i = 0; i < numEqualizers; i++) { numSections = escapedValue(2, 4, 0) + 1; lastCenterFreqP10 = 0; lastCenterFreqLd2 = 10; maxCenterFreqLd2 = 99; for (j = 0; j < numSections; j++) { centerFreqP10 = lastCenterFreqP10 + ReadRange(4 -lastCenterFreqP10); if (centerFreqP10 > lastCenterFreqP10) lastCenterFreqLd2 = 10; if (centerFreqP10 == 3) maxCenterFreqLd2 = 24; centerFreqLd2 = lastCenterFreqLd2 + ReadRange(1 + maxCenterFreqLd2 -lastCenterFreqLd2); qFactorIndex; if (qFactorIndex > 19) { qFactorExtra; } cgBits = 4 + eqExtendedRange + eqPrecisionLevel; centerGainIndex; } sgBits = 4 + eqExtendedRange + min(eqPrecisionLevel + 1, 3); scalingGainIndex; } for (i = 0; i < inputCount; i++) { hasEqualizer[i]; if (hasEqualizer[i]) { equalizerIndex[i] = ReadRange(numEqualizers); } } 1 5 3 cgBits sgBits 1 uimsbf uimsbf uimsbf uimsbf uimsbf uimsbf
[0081] Los elementos de la matriz de mezcla descendente, de acuerdo con las realizaciones, pueden ser como se muestran en la siguiente tabla 5:
Tabla 5 -Elementos de DownmixMatrix
Campo
Descripción / Valores
paramConfig,
Vectores de configuración de canales que especifican la información acerca de
inputConfig,
cada altavoz. Cada entrada, paramConfig[i], es una estructura que consta de las
outputConfig
siguientes partes: -AzimuthAngle, el valor absoluto del ángulo azimutal del altavoz; -AzimuthDirection, la dirección azimutal, 0 (izquierda) o 1 (derecha); -ElevationAngle, el valor absoluto del ángulo de elevación del altavoz; -ElevationDirection, la dirección de elevación, 0 (ascendente) o 1 (descendente); -alreadyUsed, indica si el altavoz ya es parte de un grupo; -isLFE, indica si el altavoz es un altavoz LFE.
paramCount, inputCount, outputCount
Número de altavoces en los correspondientes vectores de configuración de canales
compactParamConfig,
Vectores de configuración de canales compactos que especifican la información
compactInputConfig,
acerca de cada grupo de altavoces. Cada entrada, compactParamConfig[i], es una
compactOutputConfig
estructura que consta de las siguientes partes: -pairType, tipo de grupo de altavoces, que puede ser SIMÉTRICO (un par simétrico de dos altavoces), CENTRAL o ASIMÉTRICO; -isLFE, indica si el grupo de altavoces consisten altavoces LFE; -originalPosition, posición en la configuración de canales original del primer altavoz, o único altavoz, del grupo; -symmetricPair.originalPosition, posición en la configuración de canales original
20
del segundo altavoz del grupo, sólo para grupos SIMÉTRICOS.
compactParamCount, compactInputCount, compactOutputCount
Número de grupos de altavoces en los correspondientes vectores de configuración compacta de canales
equalizerPresent
Booleano que indica si está presente la información de ecualizador que se ha de aplicar a los canales de entrada
precisionLevel
Precisión usada para la cuantificación uniforme de las ganancias: 0 = 1 dB, 1 = 0,5 dB, 2 = 0,25 dB, 3 reservado
maxGain
Máxima ganancia real en la matriz, expresada en dB: Valores posibles de 0 a 22, en lineal 1 .. 12.589
minGain
Mínima ganancia real en la matriz, expresada en dB: Valores posibles de -1 a -47, en lineal 0,891 .. 0,004
isAllSeparable
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de separabilidad
isSeparable[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de separabilidad
isAllSymmetric
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de simetría
isSymmetric[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de simetría
mixLFEOnlyToLFE
Booleano que indica si los altavoces LFE se mezclan sólo con altavoces LFE y, al mismo tiempo, si los altavoces no LFE se mezclan sólo con altavoces no LFE
rawCodingCompactMatrix
Booleano que indica si compactDownmixMatrix es codificado raw (del inglés, crudo) (utilizando un bit por entrada) o se codifica utilizando la codificación de longitud de ejecución seguida por Golomb-Rice limitada
compactDownmixMatrix[i][j]
Una entrada en compactDownmixMatrix que corresponde al grupo de altavoces de entrada i y al grupo de altavoces de salida j, que indica si alguna de las ganancias asociadas es no cero: 0 = todas las ganancias son cero, 1 = al menos una ganancia es no cero
useCompactTemplate
Booleano que indica si se ha de aplicar una XOR por elemento a compactDownmixMatrix con una matriz plantilla compacta predefinida, para mejorar la eficacia de la codificación por longitud de ejecución
runLGRParam
Parámetro de Golomb-Rice Limitada utilizado para codificar las longitudes de ejecución cero en la flatCompactMatrix linealizada
flatCompactMatrix
Versión linealizada de compactDownmixMatrix con la matriz plantilla compacta predefinida ya aplicada; Cuando mixLFEOnlyToLFE está habilitado, esto no incluye las entradas de cero conocidas (debido a la mezcla entre no LFE y LFE) o las utilizadas para la mezcla de LFE con LFE
compactTemplate
Matriz plantilla compacta predefinida, que contiene entradas “típicas” que es sometida a XOR por elementos a compactDownmixMatrix, para mejorar la eficacia de codificación mediante la creación de entradas de valores principalmente de cero
zeroRunLength
La longitud de una ejecución cero siempre seguida por un uno, en la flatCompactMatrix, que es codificada con codificación limitada de Golomb–Rice, usando el parámetro runLGRParam
fullForAsymmetricInputs
Booleano que indica si se debe ignorar la propiedad de simetría por cada grupo asimétrico de altavoces de entrada; En caso de habilitarse, cada grupo asimétrico de altavoces de entrada tendrá dos valores de ganancia decodificados por cada grupo simétrico de altavoces de salida con el índice i, independientemente de isSymmetric[i]
gainTable
Tabla de ganancias dinámicamente generada que contiene la lista de todas las ganancias posibles entre minGain y maxGain con la precisión precisionLevel
rawCodingNonzeros
Booleano que indica si los valores de ganancia no cero se codifican raw (codificación uniforme, utilizando la función ReadRange) o sus índices en la lista gainTable se codifican utilizando codificación limitada de Golomb–Rice
gainLGRParam
Parámetro de Golomb–Rice Limitado utilizado para codificar los índices de ganancia no cero, calculado mediante la búsqueda de cada ganancia de la lista gainTable
21
imagen15
imagen16
imagen17
imagen18
imagen19

Claims (1)

  1. imagen1
    imagen2
    imagen3
    imagen4
    imagen5
ES14783660.5T 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Active ES2655046T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20130189770 EP2866227A1 (en) 2013-10-22 2013-10-22 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP13189770 2013-10-22
PCT/EP2014/071929 WO2015058991A1 (en) 2013-10-22 2014-10-13 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Publications (1)

Publication Number Publication Date
ES2655046T3 true ES2655046T3 (es) 2018-02-16

Family

ID=49474267

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14783660.5T Active ES2655046T3 (es) 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio

Country Status (19)

Country Link
US (5) US9947326B2 (es)
EP (2) EP2866227A1 (es)
JP (1) JP6313439B2 (es)
KR (1) KR101798348B1 (es)
CN (2) CN110675882B (es)
AR (1) AR098152A1 (es)
AU (1) AU2014339167B2 (es)
BR (1) BR112016008787B1 (es)
CA (1) CA2926986C (es)
ES (1) ES2655046T3 (es)
MX (1) MX353997B (es)
MY (1) MY176779A (es)
PL (1) PL3061087T3 (es)
PT (1) PT3061087T (es)
RU (1) RU2648588C2 (es)
SG (1) SG11201603089VA (es)
TW (1) TWI571866B (es)
WO (1) WO2015058991A1 (es)
ZA (1) ZA201603298B (es)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
WO2016204583A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
KR20240050483A (ko) * 2015-06-17 2024-04-18 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
EP3312837A4 (en) * 2015-06-17 2018-05-09 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
JP6921832B2 (ja) * 2016-02-03 2021-08-18 ドルビー・インターナショナル・アーベー オーディオ符号化における効率的なフォーマット変換
JP2019518373A (ja) 2016-05-06 2019-06-27 ディーティーエス・インコーポレイテッドDTS,Inc. 没入型オーディオ再生システム
JP7003924B2 (ja) * 2016-09-20 2022-01-21 ソニーグループ株式会社 情報処理装置と情報処理方法およびプログラム
US10075789B2 (en) * 2016-10-11 2018-09-11 Dts, Inc. Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction
US10659906B2 (en) * 2017-01-13 2020-05-19 Qualcomm Incorporated Audio parallax for virtual reality, augmented reality, and mixed reality
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
EP3622509B1 (en) * 2017-05-09 2021-03-24 Dolby Laboratories Licensing Corporation Processing of a multi-channel spatial audio format input signal
WO2019004524A1 (ko) * 2017-06-27 2019-01-03 엘지전자 주식회사 6자유도 환경에서 오디오 재생 방법 및 오디오 재생 장치
JP7222668B2 (ja) * 2017-11-17 2023-02-15 日本放送協会 音響処理装置及びプログラム
WO2019121980A1 (en) 2017-12-19 2019-06-27 Dolby International Ab Methods and apparatus systems for unified speech and audio decoding improvements
GB2571572A (en) * 2018-03-02 2019-09-04 Nokia Technologies Oy Audio processing
JP7371003B2 (ja) * 2018-04-11 2023-10-30 ドルビー・インターナショナル・アーベー オーディオ・レンダリングのための事前レンダリングされた信号のための方法、装置およびシステム
CN113168838A (zh) 2018-11-02 2021-07-23 杜比国际公司 音频编码器及音频解码器
GB2582749A (en) 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11967330B2 (en) 2019-08-15 2024-04-23 Dolby International Ab Methods and devices for generation and processing of modified audio bitstreams
EP4014236B1 (en) 2019-08-15 2023-03-22 Dolby Laboratories Licensing Corporation Methods and devices for generation and processing of modified bitstreams
WO2021041623A1 (en) * 2019-08-30 2021-03-04 Dolby Laboratories Licensing Corporation Channel identification of multi-channel audio signals
KR102471715B1 (ko) 2019-12-02 2022-11-29 돌비 레버러토리즈 라이쎈싱 코오포레이션 채널-기반 오디오로부터 객체-기반 오디오로의 변환을 위한 시스템, 방법 및 장치
GB2593672A (en) * 2020-03-23 2021-10-06 Nokia Technologies Oy Switching between audio instances

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108633A (en) * 1996-05-03 2000-08-22 Lsi Logic Corporation Audio decoder core constants ROM optimization
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US6522270B1 (en) * 2001-12-26 2003-02-18 Sun Microsystems, Inc. Method of coding frequently occurring values
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
AU2005219956B2 (en) * 2004-03-01 2009-05-28 Dolby Laboratories Licensing Corporation Multichannel audio coding
ES2307160T3 (es) * 2004-04-05 2008-11-16 Koninklijke Philips Electronics N.V. Codificador multicanal.
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US7848931B2 (en) * 2004-08-27 2010-12-07 Panasonic Corporation Audio encoder
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
MX2007011915A (es) * 2005-03-30 2007-11-22 Koninkl Philips Electronics Nv Codificacion de audio multicanal.
CN102163429B (zh) * 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
JP4988717B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
AU2006255662B2 (en) * 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
US7966190B2 (en) * 2005-07-11 2011-06-21 Lg Electronics Inc. Apparatus and method for processing an audio signal using linear prediction
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR100953644B1 (ko) * 2006-01-19 2010-04-20 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US9426596B2 (en) * 2006-02-03 2016-08-23 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101506875B (zh) * 2006-07-07 2012-12-19 弗劳恩霍夫应用研究促进协会 用于组合多个参数编码的音频源的设备和方法
JP5337941B2 (ja) * 2006-10-16 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル・パラメータ変換のための装置および方法
JP5270557B2 (ja) * 2006-10-16 2013-08-21 ドルビー・インターナショナル・アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
BRPI0719884B1 (pt) * 2006-12-07 2020-10-27 Lg Eletronics Inc método, aparelho e mídia legível por computador para decodificar um sinal de áudio
WO2008100098A1 (en) * 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
EP2143101B1 (en) * 2007-03-30 2020-03-11 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
AU2008243406B2 (en) * 2007-04-26 2011-08-25 Dolby International Ab Apparatus and method for synthesizing an output signal
RU2472306C2 (ru) * 2007-09-26 2013-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ для извлечения сигнала окружающей среды в устройстве и способ получения весовых коэффициентов для извлечения сигнала окружающей среды
PL2198632T3 (pl) * 2007-10-09 2014-08-29 Koninklijke Philips Nv Sposób i urządzenie do generowania dwuusznego sygnału audio
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
KR101244515B1 (ko) * 2007-10-17 2013-03-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 업믹스를 이용한 오디오 코딩
AU2008344132B2 (en) * 2008-01-01 2012-07-19 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US7733245B2 (en) * 2008-06-25 2010-06-08 Aclara Power-Line Systems Inc. Compression scheme for interval data
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
RU2493617C2 (ru) * 2008-09-11 2013-09-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
ES2415155T3 (es) * 2009-03-17 2013-07-24 Dolby International Ab Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
WO2010149700A1 (en) * 2009-06-24 2010-12-29 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012125855A1 (en) * 2011-03-16 2012-09-20 Dts, Inc. Encoding and reproduction of three dimensional audio soundtracks
WO2012177067A2 (ko) 2011-06-21 2012-12-27 삼성전자 주식회사 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
US9622014B2 (en) * 2012-06-19 2017-04-11 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
BR112015018522B1 (pt) * 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
EP2976768A4 (en) * 2013-03-20 2016-11-09 Nokia Technologies Oy AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Also Published As

Publication number Publication date
KR20160073412A (ko) 2016-06-24
AR098152A1 (es) 2016-05-04
US20200090666A1 (en) 2020-03-19
CN105723453B (zh) 2019-11-08
JP2016538585A (ja) 2016-12-08
CA2926986C (en) 2018-06-12
US20230005489A1 (en) 2023-01-05
TWI571866B (zh) 2017-02-21
EP2866227A1 (en) 2015-04-29
US10468038B2 (en) 2019-11-05
KR101798348B1 (ko) 2017-11-15
CA2926986A1 (en) 2015-04-30
MX2016004924A (es) 2016-07-11
US9947326B2 (en) 2018-04-17
BR112016008787A2 (es) 2017-08-01
JP6313439B2 (ja) 2018-04-25
SG11201603089VA (en) 2016-05-30
MY176779A (en) 2020-08-21
CN110675882A (zh) 2020-01-10
US20240304193A1 (en) 2024-09-12
BR112016008787B1 (pt) 2022-07-12
WO2015058991A1 (en) 2015-04-30
US20160232901A1 (en) 2016-08-11
EP3061087A1 (en) 2016-08-31
US11393481B2 (en) 2022-07-19
RU2648588C2 (ru) 2018-03-26
AU2014339167B2 (en) 2017-01-05
PT3061087T (pt) 2018-03-01
CN110675882B (zh) 2023-07-21
RU2016119546A (ru) 2017-11-28
US20180197553A1 (en) 2018-07-12
ZA201603298B (en) 2019-09-25
TW201521013A (zh) 2015-06-01
PL3061087T3 (pl) 2018-05-30
CN105723453A (zh) 2016-06-29
AU2014339167A1 (en) 2016-05-26
US11922957B2 (en) 2024-03-05
MX353997B (es) 2018-02-07
EP3061087B1 (en) 2017-11-22

Similar Documents

Publication Publication Date Title
ES2655046T3 (es) Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio
ES2687044T3 (es) Control de rango dinámico controlado por metadatos
ES2666127T3 (es) Decodificador, codificador y método para la estimación informada de sonoridad en sistemas de codificación de audio basada en objetos
ES2667871T3 (es) Decodificador de audio con sonoridad y metadatos de límite de programa
BR112015029132A2 (pt) codificação de cenas de áudio
ES2529219T3 (es) Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión
NO20180980A1 (no) Kompatibel flerkanal-koding/dekoding
ES2297825T3 (es) Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.
ES2373728T3 (es) Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
ES2916254T3 (es) Sonoridad de programa basada en la presentación, independiente de la transmisión
ES2945723T3 (es) Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo
ES2880779T3 (es) Método y aparato para la indexación y desindexación de cuantificación vectorial piramidal de vectores de muestra de audio/video
ES2641538T3 (es) Codificación de contenido de audio multicanal
RU2016105468A (ru) Многоканальный декоррелятор, многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием предварительного микширования входных сигналов декоррелятора
AR097012A1 (es) Decodificador de audio, codificador de audio, método para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, método para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa de computadora usando extensión de ancho de banda
AR107617A1 (es) Aparato y método para llenado estéreo en codificación multicanal
ES2560402T3 (es) Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
BR112017016341A2 (pt) codificação em modo paleta para codificação de vídeo
SI2834978T1 (en) Code encoding a coded block
RU2007141938A (ru) Энтропийное кодирование с помощью компактных кодовых книг
CO2017003348A2 (es) Un dispositivo configurado para decodificar un flujo de bits representativo de una señal de audio ambisónica de orden superior, un método de decodificación de dicho flujo de bits, un dispositivo configurado para codificar una señal de audio ambisónica de orden superior para generar un flujo de bits y un método de codificación de dicho flujo de bits
CA2843223A1 (en) Decoding device, decoding method, encoding device, encoding method, and program
ES2903247T3 (es) Codificación en capas y estructura de datos para representaciones comprimidas de campo sonoro o sonido ambisónico de orden superior
BRPI0611546B1 (pt) Codificação sem perdas de informações com taxa de bits máxima garantida
AR113482A1 (es) Codificadores de audio, decodificadores de audio, métodos y programas de computadora que adaptan una codificación y decodificación de bits menos significativos