ES2655046T3 - Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio - Google Patents

Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Download PDF

Info

Publication number
ES2655046T3
ES2655046T3 ES14783660.5T ES14783660T ES2655046T3 ES 2655046 T3 ES2655046 T3 ES 2655046T3 ES 14783660 T ES14783660 T ES 14783660T ES 2655046 T3 ES2655046 T3 ES 2655046T3
Authority
ES
Spain
Prior art keywords
matrix
input
down mix
mix matrix
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14783660.5T
Other languages
English (en)
Inventor
Florin Ghido
Achim Kuntz
Bernhard Grill
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2655046T3 publication Critical patent/ES2655046T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un procedimiento para decodificar una matriz de mezcla descendente (306) para mapear una pluralidad de canales de entrada (300) de contenido de audio con una pluralidad de canales de salida (302), en el que los canales de entrada y salida (300, 302) están asociados a respectivos altavoces en posiciones predeterminadas con respecto a la posición de un oyente, en la que la matriz de mezcla descendente (306) es codificada mediante el aprovechamiento de la simetría de los pares de altavoces (S1-S9) de la pluralidad de canales de entrada (300) y la simetría de los pares de altavoces (S10-S11) de la pluralidad de canales de salida (302), comprendiendo el procedimiento: recibir información codificada que representa la matriz de mezcla descendente codificada (306) de un codificador y decodificar la información codificada para obtener la matriz de mezcla descendente decodificada (306), en el cual los respectivos pares (S1-S11) de canales de entrada y salida (300, 302) de la matriz de mezcla descendente (306) tienen asociadas respectivas ganancias de mezcla para adaptar un nivel en el cual un canal de entrada dado (300) contribuye a un canal de salida dado (302) y en el que el procedimiento comprende además: la decodificación de la información que representa los valores de significancia de la matriz de mezcla descendente codificada (306), en la que los respectivos valores de significancia son asignados a pares (S1-S11) de grupos simétricos de altavoces de los canales de entrada (300) y grupos de altavoces simétricos de los canales de salida (302), indicando el valor de significancia si una ganancia de mezcla para uno o más de los canales de entrada (300) es cero o no y la decodificación a partir de la información que representa la matriz de mezcla descendente (306) las ganancias de mezcla codificadas.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
imagen7
imagen8
imagen9
imagen10
imagen11
[0055] Ahora se puede codificar esta lista, por ejemplo, utilizando también la codificación limitada de Golomb-Rice. En comparación con la realización descrita con respecto a la Fig. 6, se puede ver que se puede codificar esta 5 lista de manera aun más eficaz. En el mejor de los casos, cuando la matriz compacta es idéntica a la matriz plantilla, la totalidad del vector consiste sólo en ceros y sólo se debe codificar un número de longitudes de ejecución.
[0056] En lo que respecta al uso de una matriz plantilla, como se describiera con respecto a la Fig. 7, cabe señalar que tanto el codificador como el decodificador tienen que tener una serie predeterminada de dichas plantillas
10 compactas, lo que se determina de forma individual mediante una serie de altavoces de entrada y salida, a diferencia de una configuración de entrada o salida que está determinada por la lista de altavoces. Esto significa que el orden de los altavoces de entrada y salida no es relevante para determinar la matriz plantilla, sino que puede ser permutado antes de usarse para equipararse al orden de una matriz compacta dada.
15 [0057] En lo sucesivo, como ya se ha mencionado anteriormente, se pasa a describir realizaciones con respecto a la codificación de las ganancias de mezcla proporcionadas en la matriz de mezcla descendente original que ya no están presentes en la matriz de mezcla compacta y que también deben ser codificadas y transmitidas.
[0058] La Fig. 8 describe una realización para codificar las ganancias de mezcla. Esta realización hace uso
20 de las propiedades de las sub-matrices que corresponden a dichas una o más entradas no cero de la matriz de mezcla descendente original, de acuerdo con diferentes combinaciones de grupos de altavoces de entrada y salida, es decir los grupos S (simétricos, L y R), C (central) y A (asimétricos). La Fig. 8 describe sub-matrices posibles que se pueden derivar de la matriz de mezcla descendente mostrada en la Fig. 4, de acuerdo con diferentes combinaciones de altavoces de entrada y salida, a saber, los altavoces simétricos L y R, los canales centrales C y
25 los altavoces asimétricos A. En la Fig. 8, las letras a, b, c y d representan valores de ganancia arbitrarios.
[0059] La Fig. 8A ilustra cuatro sub-matrices posibles que se pueden derivar de la matriz de la Fig. 4. La primera es la sub-matriz que define el mapeo de dos canales centrales, por ejemplo los altavoces C en la configuración de entrada 300 y el altavoz C en la configuración de salida 302, y el valor de ganancia “a” es el valor 30 de ganancia indicado en el elemento de la matriz [1,1] (elemento de superior izquierdo de la Fig. 4). La segunda submatriz de la Fig. 8A representa, por ejemplo, el mapeo de dos canales de entrada simétricos, por ejemplo los canales de entrada Lc y Rc, con un altavoz central, tal como el altavoz C, en la configuración de los canales de salida. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [1,2] y [1,3]. La tercera sub-matriz de la Fig. 8A se refiere al mapeo de un altavoz central C, tal como el altavoz Cvr de la 35 configuración de entrada 300 de la Fig. 4, con dos canales simétricos tales como los canales Ls y Rs, de la configuración de salida 302. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [4,21] y [5,21]. La cuarta sub-matriz de la Fig. 8A representa un caso en que se mapean dos canales simétricos, por ejemplo los canales L, R de la configuración de entrada 300 se mapean con los canales L, R de la configuración de salida 302. Los valores de ganancia “a” a “d” son los valores de ganancia indicados en los
40 elementos de matriz [2,4], [2,5], [3,4] y [3,5].
[0060] La Fig. 8B ilustra las sub-matrices cuando se mapean altavoces asimétricos. La primera representación es una sub-matriz que se obtiene al mapear dos altavoces asimétricos (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4). La segunda sub-matriz de la Fig. 8B se refiere al mapeo de dos
45 canales de entrada simétricos con un canal de salida asimétrico que, en la realización de la Fig. 4 es, por ejemplo, el mapeo de los dos canales de entrada simétricos LFE y LFE2 con el canal de salida LFE. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [6,11] y [6,12]. La terceras sub-matrices de la Fig. 8B representa el caso en que se corresponde un altavoz asimétrico de entrada con un par de altavoces de salida simétrico. En el caso del ejemplo no hay ningún altavoz de entrada asimétrico.
50 [0061] La Fig. 8C ilustra dos sub-matrices para el mapeo de los canales centrales con altavoces asimétricos. La primera sub-matriz mapea un altavoz central de entrada a un altavoz asimétrico de salida (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4), y la segunda sub-matriz mapea un altavoz de entrada asimétrico con un altavoz central de salida.
55 [0062] De acuerdo con esta realización, por cada grupo de altavoces de salida, se verifica si la columna
12
imagen12
detenerse aquí si el nivel de precisión es 0,5 dB; -sumar el resto de los enteros múltiplos de 0,25 dB, descendiendo de 0 dB a minGain y sumar el resto de los enteros múltiplos de 0,25 dB, ascendiendo de 0,25 dB a maxGain.
5 [0067] Por ejemplo, cuando maxGain es 2 dB y minGain es -6 dB y la precisión es 0,5 dB, se genera la siguiente lista:
0, -3, -6, -1, -2, -4, -5, 1, 2, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5, 0,5, 1,5.
10 [0068] En lo que respecta a la realización anterior, cabe señalar que la invención no se limita a los valores anteriormente indicados; por el contrario, en lugar de utilizar enteros múltiplos de 3dB y a partir de 0dB, se pueden seleccionar otros valores y también se pueden seleccionar otros valores del nivel de precisión, dependiendo de las circunstancias.
15 [0069] En general, la lista de valores de ganancia se puede generar de la siguiente manera:
-sumar enteros múltiplos de un primer valor de ganancia, entre la ganancia mínima, inclusive, y un valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer valor de ganancia, entre el valor de ganancia inicial, inclusive, y la
20 ganancia máxima, inclusive, en orden creciente; -sumar el resto de los enteros múltiplos de un primer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
25 -detenerse aquí si el nivel de precisión es el primer nivel de precisión; -sumar el resto de los enteros múltiplos de un segundo nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del segundo nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
30 -detenerse aquí si el nivel de precisión es el segundo nivel de precisión; -sumar el resto de los enteros múltiplos de un tercer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente y -sumar el resto de los enteros múltiplos del tercer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente.
35 [0070] En la realización anterior, cuando el valor de ganancia inicial es cero, las partes que suman los valores restantes en orden creciente y que satisfacen la condición de multiplicidad asociada suman inicialmente el primer valor de ganancia o el primero, segundo o tercer nivel de precisión. Sin embargo, en la generalidad de los casos, las partes que suman los valores restantes en orden creciente suman inicialmente el menor valor, satisfaciendo la
40 condición de multiplicidad asociada, en el intervalo entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive. De manera correspondiente, las partes que suman los valores restantes en orden decreciente suman inicialmente el valor más grande, satisfaciendo la condición de multiplicidad asociada, en el intervalo entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive.
45 [0071] Considerando un ejemplo similar al anterior pero con un valor de ganancia inicial = 1dB (un primer valor de ganancia = 3dB, maxGain = 2dB, minGain = -6dB y un nivel de precisión = 0,5dB) da lo siguiente:
Descendente: 0, -3, -6 Ascendente: [vacío]
50 Descendente: 1, -2, -4, -5 Ascendente: 2 Descendente: 0,5, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5 Ascendente: 1,5
55 [0072] Para codificar un valor de ganancia, preferentemente se busca la ganancia en la tabla y se emite su posición dentro de la tabla. Siempre se encuentra la ganancia deseada, puesto que todas las ganancias son previamente cuantificadas al número entero más cercano múltiplo de la precisión estipulada de, por ejemplo, 1dB, 0,5dB o 0,25dB. De acuerdo con una realización preferida, las posiciones de los valores de ganancia tienen un índice asociado que indica la posición en la tabla y los índices de las ganancias pueden ser codificados, por ejemplo,
14
imagen13
matriz de mezcla descendente está indicado en el flujo de bits como un valor de ganancia máxima maxGain y un valor de ganancia mínima minGain; por lo tanto no se desperdician bits en valores que no se utilizan en realidad y a la vez no se limita la flexibilidad.
5 [0077] Suponiendo que se dispone de una lista de canales de entrada y también de una lista de canales de salida que aportan información geométrica sobre cada altavoz, como por ejemplo los ángulos azimutal y de elevación y, opcionalmente, el nombre convencional del altavoz, por ejemplo de acuerdo con las referencias de la técnica anterior [6] o [7], un algoritmo para codificar una matriz de mezcla descendente, de acuerdo con las realizaciones puede ser el mostrado a continuación en la tabla 1:
10 Tabla 1 -Sintaxis de DownmixMatrix
Sintaxis
No. de bits Mnemónico
DownmixMatrix(inputConfig, inputCount, outputConfig, outputCount) {
equalizerPresent; if (equalizerPresent) { EqualizerConfig(inputConfig, inputCount); }
1 uimsbf
precisionLevel; maxGain = escapedValue(3, 4, 0); minGain = escapedValue(4, 5, 0) + 1; ConvertToCompactConfig(inputConfig, inputCount); ConvertToCompactConfig(outputConfig, outputCount);
2 uimsbf
isAllSeparable; if (!isAllSeparable) { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) {
1 uimsbf
isSeparable[i]; } } } else { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) { isSeparable[i] = 1; } } }
1 uimsbf
isAllSymmetric; if (!isAllSymmetric) { for (i = 0; i < compactOutputCount; i++) {
1 uimsbf
isSymmetric[i]; } } else { for (i = 0; i < compactOutputCount; i++) { isSymmetric[i] = 1; }
1 uimsbf
mixLFEOnlyToLFE;
1 uimsbf
rawCodingCompactMatrix; if (rawCodingCompactMatrix) { for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (!mixLFEOnlyToLFE || (compactInputConfig[i].isLFE == compactOutputConfig[j].isLFE)) {
1 uimsbf
compactDownmixMatrix[i][j];
1 uimsbf
16
} else { compactDownmixMatrix[i][j] = 0; } } } } else { if (mixLFEOnlyToLFE) { compactInputLFECount = 0; compactOutputLFECount = 0; for (i = 0; i < compactInputCount; i++) { if (compactInputConfig[i].isLFE) compactInputLFECount++; } for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].isLFE) compactOutputLFECount++; } totalCount = (compactInputCount -compactInputLFECount) * (compactOutputCount -compactOutputLFECount); } else { totalCount = compactInputCount * compactOutputCount; } useCompactTemplate; n = 3; if (totalCount >= 256) n = 4; runLGRParam; count = 0; flatCompactMatrix[totalCount + 1]; while (count < totalCount) { zeroRunLength; /* limited Golomb-Rice using runLGRparam */ flatCompactMatrix[count .. count + zeroRunLength] = {0, ..., 0, 1}; count += zeroRunLength + 1; } count = 0; for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (mixLFEOnlyToLFE && compactInputConfig[i].isLFE && compactOutputConfig[j].isLFE) { compactDownmixMatrix[i][j]; } else if (mixLFEOnlyToLFE && (compactInputConfig[i].isLFE ^ compactOutputConfig[j].isLFE)) { compactDownmixMatrix[i][j] = 0; } else { compactDownmixMatrix[i][j] = flatCompactMatrix[count++]; } } } if (useCompactTemplate) { compactTemplate = FindCompactTemplate(inputConfig, inputCount, outputConfig, outputCount); for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { compactDownmixMatrix[i][j] ^= compactTemplate[i][j]; } } } } fullForAsymmetricInputs;
1 n varía 1 1 1 uimsbf uimsbf bslbf uimsbf uimsbf uimsbf
17
rawCodingNonzeros; if (!rawCodingNonzeros) { gainLGRParam; generateGainTable(maxGain, minGain, precisionLevel); } for (i = 0; i < compactInputCount; i++) { iType = compactInputConfig[i].pairType; for (j = 0; j < compactOutputCount; j++) { oType = compactOutputConfig[j].pairType; i1 = compactInputConfig[i].originalPosition; o1 = compactOutputConfig[j].originalPosition; if ((iType != SYMMETRIC) && (oType != SYMMETRIC)) { downmixMatrix[i1][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); } else if (iType != SYMMETRIC) { o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); useFull = (iType == ASYMMETRIC) && fullForAsymmetricInputs; if (isSymmetric[j] && !useFull) { downmixMatrix[i1][o2] = downmixMatrix[i1][o1]; } else { downmixMatrix[i1][o2] = DecodeGainValue(); } } else if (oType != SYMMETRIC) { i2 = compactInputConfig[i].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i2][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSymmetric[j]) { downmixMatrix[i2][o1] = downmixMatrix[i1][o1]; } else { downmixMatrix[i2][o1] = DecodeGainValue(); } } else { i2 = compactInputConfig[i].SymmetricPair.originalPosition; o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; downmixMatrix[i2][o1] = 0.0; downmixMatrix[i2][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSeparable[j] && isSymmetric[j]) { downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (!isSeparable[j] && isSymmetric[j]) { downmixMatrix[i1][o2] = DecodeGainValue(); downmixMatrix[i2][o1] = downmixMatrix[i1][o2]; downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (isSeparable[j] && !isSymmetric[j]) {
3 uimsbf
18
imagen14
}
eqExtendedRange; for (i = 0; i < numEqualizers; i++) { numSections = escapedValue(2, 4, 0) + 1; lastCenterFreqP10 = 0; lastCenterFreqLd2 = 10; maxCenterFreqLd2 = 99; for (j = 0; j < numSections; j++) { centerFreqP10 = lastCenterFreqP10 + ReadRange(4 -lastCenterFreqP10); if (centerFreqP10 > lastCenterFreqP10) lastCenterFreqLd2 = 10; if (centerFreqP10 == 3) maxCenterFreqLd2 = 24; centerFreqLd2 = lastCenterFreqLd2 + ReadRange(1 + maxCenterFreqLd2 -lastCenterFreqLd2); qFactorIndex; if (qFactorIndex > 19) { qFactorExtra; } cgBits = 4 + eqExtendedRange + eqPrecisionLevel; centerGainIndex; } sgBits = 4 + eqExtendedRange + min(eqPrecisionLevel + 1, 3); scalingGainIndex; } for (i = 0; i < inputCount; i++) { hasEqualizer[i]; if (hasEqualizer[i]) { equalizerIndex[i] = ReadRange(numEqualizers); } } 1 5 3 cgBits sgBits 1 uimsbf uimsbf uimsbf uimsbf uimsbf uimsbf
[0081] Los elementos de la matriz de mezcla descendente, de acuerdo con las realizaciones, pueden ser como se muestran en la siguiente tabla 5:
Tabla 5 -Elementos de DownmixMatrix
Campo
Descripción / Valores
paramConfig,
Vectores de configuración de canales que especifican la información acerca de
inputConfig,
cada altavoz. Cada entrada, paramConfig[i], es una estructura que consta de las
outputConfig
siguientes partes: -AzimuthAngle, el valor absoluto del ángulo azimutal del altavoz; -AzimuthDirection, la dirección azimutal, 0 (izquierda) o 1 (derecha); -ElevationAngle, el valor absoluto del ángulo de elevación del altavoz; -ElevationDirection, la dirección de elevación, 0 (ascendente) o 1 (descendente); -alreadyUsed, indica si el altavoz ya es parte de un grupo; -isLFE, indica si el altavoz es un altavoz LFE.
paramCount, inputCount, outputCount
Número de altavoces en los correspondientes vectores de configuración de canales
compactParamConfig,
Vectores de configuración de canales compactos que especifican la información
compactInputConfig,
acerca de cada grupo de altavoces. Cada entrada, compactParamConfig[i], es una
compactOutputConfig
estructura que consta de las siguientes partes: -pairType, tipo de grupo de altavoces, que puede ser SIMÉTRICO (un par simétrico de dos altavoces), CENTRAL o ASIMÉTRICO; -isLFE, indica si el grupo de altavoces consisten altavoces LFE; -originalPosition, posición en la configuración de canales original del primer altavoz, o único altavoz, del grupo; -symmetricPair.originalPosition, posición en la configuración de canales original
20
del segundo altavoz del grupo, sólo para grupos SIMÉTRICOS.
compactParamCount, compactInputCount, compactOutputCount
Número de grupos de altavoces en los correspondientes vectores de configuración compacta de canales
equalizerPresent
Booleano que indica si está presente la información de ecualizador que se ha de aplicar a los canales de entrada
precisionLevel
Precisión usada para la cuantificación uniforme de las ganancias: 0 = 1 dB, 1 = 0,5 dB, 2 = 0,25 dB, 3 reservado
maxGain
Máxima ganancia real en la matriz, expresada en dB: Valores posibles de 0 a 22, en lineal 1 .. 12.589
minGain
Mínima ganancia real en la matriz, expresada en dB: Valores posibles de -1 a -47, en lineal 0,891 .. 0,004
isAllSeparable
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de separabilidad
isSeparable[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de separabilidad
isAllSymmetric
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de simetría
isSymmetric[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de simetría
mixLFEOnlyToLFE
Booleano que indica si los altavoces LFE se mezclan sólo con altavoces LFE y, al mismo tiempo, si los altavoces no LFE se mezclan sólo con altavoces no LFE
rawCodingCompactMatrix
Booleano que indica si compactDownmixMatrix es codificado raw (del inglés, crudo) (utilizando un bit por entrada) o se codifica utilizando la codificación de longitud de ejecución seguida por Golomb-Rice limitada
compactDownmixMatrix[i][j]
Una entrada en compactDownmixMatrix que corresponde al grupo de altavoces de entrada i y al grupo de altavoces de salida j, que indica si alguna de las ganancias asociadas es no cero: 0 = todas las ganancias son cero, 1 = al menos una ganancia es no cero
useCompactTemplate
Booleano que indica si se ha de aplicar una XOR por elemento a compactDownmixMatrix con una matriz plantilla compacta predefinida, para mejorar la eficacia de la codificación por longitud de ejecución
runLGRParam
Parámetro de Golomb-Rice Limitada utilizado para codificar las longitudes de ejecución cero en la flatCompactMatrix linealizada
flatCompactMatrix
Versión linealizada de compactDownmixMatrix con la matriz plantilla compacta predefinida ya aplicada; Cuando mixLFEOnlyToLFE está habilitado, esto no incluye las entradas de cero conocidas (debido a la mezcla entre no LFE y LFE) o las utilizadas para la mezcla de LFE con LFE
compactTemplate
Matriz plantilla compacta predefinida, que contiene entradas “típicas” que es sometida a XOR por elementos a compactDownmixMatrix, para mejorar la eficacia de codificación mediante la creación de entradas de valores principalmente de cero
zeroRunLength
La longitud de una ejecución cero siempre seguida por un uno, en la flatCompactMatrix, que es codificada con codificación limitada de Golomb–Rice, usando el parámetro runLGRParam
fullForAsymmetricInputs
Booleano que indica si se debe ignorar la propiedad de simetría por cada grupo asimétrico de altavoces de entrada; En caso de habilitarse, cada grupo asimétrico de altavoces de entrada tendrá dos valores de ganancia decodificados por cada grupo simétrico de altavoces de salida con el índice i, independientemente de isSymmetric[i]
gainTable
Tabla de ganancias dinámicamente generada que contiene la lista de todas las ganancias posibles entre minGain y maxGain con la precisión precisionLevel
rawCodingNonzeros
Booleano que indica si los valores de ganancia no cero se codifican raw (codificación uniforme, utilizando la función ReadRange) o sus índices en la lista gainTable se codifican utilizando codificación limitada de Golomb–Rice
gainLGRParam
Parámetro de Golomb–Rice Limitado utilizado para codificar los índices de ganancia no cero, calculado mediante la búsqueda de cada ganancia de la lista gainTable
21
imagen15
imagen16
imagen17
imagen18
imagen19

Claims (1)

  1. imagen1
    imagen2
    imagen3
    imagen4
    imagen5
ES14783660.5T 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Active ES2655046T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13189770 2013-10-22
EP20130189770 EP2866227A1 (en) 2013-10-22 2013-10-22 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
PCT/EP2014/071929 WO2015058991A1 (en) 2013-10-22 2014-10-13 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Publications (1)

Publication Number Publication Date
ES2655046T3 true ES2655046T3 (es) 2018-02-16

Family

ID=49474267

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14783660.5T Active ES2655046T3 (es) 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio

Country Status (19)

Country Link
US (5) US9947326B2 (es)
EP (2) EP2866227A1 (es)
JP (1) JP6313439B2 (es)
KR (1) KR101798348B1 (es)
CN (2) CN110675882B (es)
AR (1) AR098152A1 (es)
AU (1) AU2014339167B2 (es)
BR (1) BR112016008787B1 (es)
CA (1) CA2926986C (es)
ES (1) ES2655046T3 (es)
MX (1) MX353997B (es)
MY (1) MY176779A (es)
PL (1) PL3061087T3 (es)
PT (1) PT3061087T (es)
RU (1) RU2648588C2 (es)
SG (1) SG11201603089VA (es)
TW (1) TWI571866B (es)
WO (1) WO2015058991A1 (es)
ZA (1) ZA201603298B (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
WO2016204581A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
KR102627374B1 (ko) * 2015-06-17 2024-01-19 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
WO2016204579A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
JP6921832B2 (ja) * 2016-02-03 2021-08-18 ドルビー・インターナショナル・アーベー オーディオ符号化における効率的なフォーマット変換
WO2017192972A1 (en) 2016-05-06 2017-11-09 Dts, Inc. Immersive audio reproduction systems
CN109716794B (zh) * 2016-09-20 2021-07-13 索尼公司 信息处理装置、信息处理方法及计算机可读存储介质
US10075789B2 (en) * 2016-10-11 2018-09-11 Dts, Inc. Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction
US10659906B2 (en) * 2017-01-13 2020-05-19 Qualcomm Incorporated Audio parallax for virtual reality, augmented reality, and mixed reality
US10979844B2 (en) * 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
CN110800048B (zh) * 2017-05-09 2023-07-28 杜比实验室特许公司 多通道空间音频格式输入信号的处理
US11089425B2 (en) * 2017-06-27 2021-08-10 Lg Electronics Inc. Audio playback method and audio playback apparatus in six degrees of freedom environment
JP7222668B2 (ja) * 2017-11-17 2023-02-15 日本放送協会 音響処理装置及びプログラム
BR112020012648A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados
GB2571572A (en) * 2018-03-02 2019-09-04 Nokia Technologies Oy Audio processing
CN115334444A (zh) * 2018-04-11 2022-11-11 杜比国际公司 用于音频渲染的预渲染信号的方法、设备和系统
EP3874491B1 (en) 2018-11-02 2024-05-01 Dolby International AB Audio encoder and audio decoder
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
JP7314398B2 (ja) 2019-08-15 2023-07-25 ドルビー・インターナショナル・アーベー 変更オーディオビットストリームの生成及び処理のための方法及び装置
CN114303392A (zh) * 2019-08-30 2022-04-08 杜比实验室特许公司 多声道音频信号的声道标识
WO2021113350A1 (en) 2019-12-02 2021-06-10 Dolby Laboratories Licensing Corporation Systems, methods and apparatus for conversion from channel-based audio to object-based audio
GB2593672A (en) * 2020-03-23 2021-10-06 Nokia Technologies Oy Switching between audio instances

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108633A (en) * 1996-05-03 2000-08-22 Lsi Logic Corporation Audio decoder core constants ROM optimization
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US6522270B1 (en) * 2001-12-26 2003-02-18 Sun Microsystems, Inc. Method of coding frequently occurring values
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
CA2992097C (en) * 2004-03-01 2018-09-11 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
DE602005006777D1 (de) * 2004-04-05 2008-06-26 Koninkl Philips Electronics Nv Mehrkanal-codierer
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
MX2007011915A (es) * 2005-03-30 2007-11-22 Koninkl Philips Electronics Nv Codificacion de audio multicanal.
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP4988717B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US7830921B2 (en) * 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8160888B2 (en) * 2005-07-19 2012-04-17 Koninklijke Philips Electronics N.V Generation of multi-channel audio signals
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
US9426596B2 (en) * 2006-02-03 2016-08-23 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101506875B (zh) * 2006-07-07 2012-12-19 弗劳恩霍夫应用研究促进协会 用于组合多个参数编码的音频源的设备和方法
SG175632A1 (en) * 2006-10-16 2011-11-28 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP5337941B2 (ja) * 2006-10-16 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル・パラメータ変換のための装置および方法
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
JP5254983B2 (ja) * 2007-02-14 2013-08-07 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP5133401B2 (ja) * 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
CN101816191B (zh) * 2007-09-26 2014-09-17 弗劳恩霍夫应用研究促进协会 用于提取环境信号的装置和方法
CA2701360C (en) * 2007-10-09 2014-04-22 Dirk Jeroen Breebaart Method and apparatus for generating a binaural audio signal
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
KR101147780B1 (ko) * 2008-01-01 2012-06-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US7733245B2 (en) * 2008-06-25 2010-06-08 Aclara Power-Line Systems Inc. Compression scheme for interval data
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
BRPI1009467B1 (pt) * 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
ES2524428T3 (es) * 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
EP2686654A4 (en) * 2011-03-16 2015-03-11 Dts Inc CODING AND PLAYING THREE-DIMENSIONAL AUDIOSPURES
WO2012177067A2 (ko) 2011-06-21 2012-12-27 삼성전자 주식회사 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
EP2862370B1 (en) * 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
WO2014147441A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Audio signal encoder comprising a multi-channel parameter selector
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Also Published As

Publication number Publication date
CN105723453A (zh) 2016-06-29
TW201521013A (zh) 2015-06-01
PL3061087T3 (pl) 2018-05-30
AR098152A1 (es) 2016-05-04
RU2016119546A (ru) 2017-11-28
CA2926986C (en) 2018-06-12
AU2014339167A1 (en) 2016-05-26
US20230005489A1 (en) 2023-01-05
US20240304193A1 (en) 2024-09-12
ZA201603298B (en) 2019-09-25
RU2648588C2 (ru) 2018-03-26
KR101798348B1 (ko) 2017-11-15
EP2866227A1 (en) 2015-04-29
SG11201603089VA (en) 2016-05-30
EP3061087A1 (en) 2016-08-31
CN105723453B (zh) 2019-11-08
BR112016008787B1 (pt) 2022-07-12
US20160232901A1 (en) 2016-08-11
US10468038B2 (en) 2019-11-05
WO2015058991A1 (en) 2015-04-30
KR20160073412A (ko) 2016-06-24
BR112016008787A2 (es) 2017-08-01
US11922957B2 (en) 2024-03-05
EP3061087B1 (en) 2017-11-22
JP2016538585A (ja) 2016-12-08
MX2016004924A (es) 2016-07-11
US20180197553A1 (en) 2018-07-12
TWI571866B (zh) 2017-02-21
JP6313439B2 (ja) 2018-04-25
CA2926986A1 (en) 2015-04-30
MX353997B (es) 2018-02-07
PT3061087T (pt) 2018-03-01
US11393481B2 (en) 2022-07-19
US20200090666A1 (en) 2020-03-19
AU2014339167B2 (en) 2017-01-05
CN110675882B (zh) 2023-07-21
US9947326B2 (en) 2018-04-17
MY176779A (en) 2020-08-21
CN110675882A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
ES2655046T3 (es) Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio
ES2930374T3 (es) Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia
ES2688387T3 (es) Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida
ES2667871T3 (es) Decodificador de audio con sonoridad y metadatos de límite de programa
BR112015029132A2 (pt) codificação de cenas de áudio
NO20180990A1 (no) Kompatibel flerkanal-koding/dekoding.
ES2529219T3 (es) Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión
ES2916254T3 (es) Sonoridad de programa basada en la presentación, independiente de la transmisión
ES2454670T3 (es) Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada
ES2641538T3 (es) Codificación de contenido de audio multicanal
ES2880779T3 (es) Método y aparato para la indexación y desindexación de cuantificación vectorial piramidal de vectores de muestra de audio/video
ES2645839T3 (es) Cuantificación de parámetros no uniforme para acoplamiento avanzado
ES2945723T3 (es) Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo
AR097012A1 (es) Decodificador de audio, codificador de audio, método para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, método para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa de computadora usando extensión de ancho de banda
AR107617A1 (es) Aparato y método para llenado estéreo en codificación multicanal
RU2016105468A (ru) Многоканальный декоррелятор, многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием предварительного микширования входных сигналов декоррелятора
ES2560402T3 (es) Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
AR097003A1 (es) Concepto para codificación y decodificación de audio para canales de audio y objetos de audio
BR112022005458A2 (pt) Dispositivos de codificação e de decodificação de vídeo, e de produto de computador, e métodos associados
RU2007141938A (ru) Энтропийное кодирование с помощью компактных кодовых книг
ES2903247T3 (es) Codificación en capas y estructura de datos para representaciones comprimidas de campo sonoro o sonido ambisónico de orden superior
JP2016526186A (ja) オーディオ・エンコーダおよびデコーダ
RU2007141936A (ru) Кодирование информации без потерь с гарантированной максимальной битовой скоростью
AR113482A1 (es) Codificadores de audio, decodificadores de audio, métodos y programas de computadora que adaptan una codificación y decodificación de bits menos significativos
BR112022007735A2 (pt) Distribuição de taxa de bits em serviços de voz e áudio imersivos