ES2655046T3 - Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio - Google Patents
Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Download PDFInfo
- Publication number
- ES2655046T3 ES2655046T3 ES14783660.5T ES14783660T ES2655046T3 ES 2655046 T3 ES2655046 T3 ES 2655046T3 ES 14783660 T ES14783660 T ES 14783660T ES 2655046 T3 ES2655046 T3 ES 2655046T3
- Authority
- ES
- Spain
- Prior art keywords
- matrix
- input
- down mix
- mix matrix
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title abstract description 41
- 238000000034 method Methods 0.000 title abstract 5
- 238000013507 mapping Methods 0.000 description 8
- 230000001174 ascending effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000001343 mnemonic effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un procedimiento para decodificar una matriz de mezcla descendente (306) para mapear una pluralidad de canales de entrada (300) de contenido de audio con una pluralidad de canales de salida (302), en el que los canales de entrada y salida (300, 302) están asociados a respectivos altavoces en posiciones predeterminadas con respecto a la posición de un oyente, en la que la matriz de mezcla descendente (306) es codificada mediante el aprovechamiento de la simetría de los pares de altavoces (S1-S9) de la pluralidad de canales de entrada (300) y la simetría de los pares de altavoces (S10-S11) de la pluralidad de canales de salida (302), comprendiendo el procedimiento: recibir información codificada que representa la matriz de mezcla descendente codificada (306) de un codificador y decodificar la información codificada para obtener la matriz de mezcla descendente decodificada (306), en el cual los respectivos pares (S1-S11) de canales de entrada y salida (300, 302) de la matriz de mezcla descendente (306) tienen asociadas respectivas ganancias de mezcla para adaptar un nivel en el cual un canal de entrada dado (300) contribuye a un canal de salida dado (302) y en el que el procedimiento comprende además: la decodificación de la información que representa los valores de significancia de la matriz de mezcla descendente codificada (306), en la que los respectivos valores de significancia son asignados a pares (S1-S11) de grupos simétricos de altavoces de los canales de entrada (300) y grupos de altavoces simétricos de los canales de salida (302), indicando el valor de significancia si una ganancia de mezcla para uno o más de los canales de entrada (300) es cero o no y la decodificación a partir de la información que representa la matriz de mezcla descendente (306) las ganancias de mezcla codificadas.
Description
[0055] Ahora se puede codificar esta lista, por ejemplo, utilizando también la codificación limitada de Golomb-Rice. En comparación con la realización descrita con respecto a la Fig. 6, se puede ver que se puede codificar esta 5 lista de manera aun más eficaz. En el mejor de los casos, cuando la matriz compacta es idéntica a la matriz plantilla, la totalidad del vector consiste sólo en ceros y sólo se debe codificar un número de longitudes de ejecución.
[0056] En lo que respecta al uso de una matriz plantilla, como se describiera con respecto a la Fig. 7, cabe señalar que tanto el codificador como el decodificador tienen que tener una serie predeterminada de dichas plantillas
10 compactas, lo que se determina de forma individual mediante una serie de altavoces de entrada y salida, a diferencia de una configuración de entrada o salida que está determinada por la lista de altavoces. Esto significa que el orden de los altavoces de entrada y salida no es relevante para determinar la matriz plantilla, sino que puede ser permutado antes de usarse para equipararse al orden de una matriz compacta dada.
15 [0057] En lo sucesivo, como ya se ha mencionado anteriormente, se pasa a describir realizaciones con respecto a la codificación de las ganancias de mezcla proporcionadas en la matriz de mezcla descendente original que ya no están presentes en la matriz de mezcla compacta y que también deben ser codificadas y transmitidas.
[0058] La Fig. 8 describe una realización para codificar las ganancias de mezcla. Esta realización hace uso
20 de las propiedades de las sub-matrices que corresponden a dichas una o más entradas no cero de la matriz de mezcla descendente original, de acuerdo con diferentes combinaciones de grupos de altavoces de entrada y salida, es decir los grupos S (simétricos, L y R), C (central) y A (asimétricos). La Fig. 8 describe sub-matrices posibles que se pueden derivar de la matriz de mezcla descendente mostrada en la Fig. 4, de acuerdo con diferentes combinaciones de altavoces de entrada y salida, a saber, los altavoces simétricos L y R, los canales centrales C y
25 los altavoces asimétricos A. En la Fig. 8, las letras a, b, c y d representan valores de ganancia arbitrarios.
[0059] La Fig. 8A ilustra cuatro sub-matrices posibles que se pueden derivar de la matriz de la Fig. 4. La primera es la sub-matriz que define el mapeo de dos canales centrales, por ejemplo los altavoces C en la configuración de entrada 300 y el altavoz C en la configuración de salida 302, y el valor de ganancia “a” es el valor 30 de ganancia indicado en el elemento de la matriz [1,1] (elemento de superior izquierdo de la Fig. 4). La segunda submatriz de la Fig. 8A representa, por ejemplo, el mapeo de dos canales de entrada simétricos, por ejemplo los canales de entrada Lc y Rc, con un altavoz central, tal como el altavoz C, en la configuración de los canales de salida. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [1,2] y [1,3]. La tercera sub-matriz de la Fig. 8A se refiere al mapeo de un altavoz central C, tal como el altavoz Cvr de la 35 configuración de entrada 300 de la Fig. 4, con dos canales simétricos tales como los canales Ls y Rs, de la configuración de salida 302. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [4,21] y [5,21]. La cuarta sub-matriz de la Fig. 8A representa un caso en que se mapean dos canales simétricos, por ejemplo los canales L, R de la configuración de entrada 300 se mapean con los canales L, R de la configuración de salida 302. Los valores de ganancia “a” a “d” son los valores de ganancia indicados en los
40 elementos de matriz [2,4], [2,5], [3,4] y [3,5].
[0060] La Fig. 8B ilustra las sub-matrices cuando se mapean altavoces asimétricos. La primera representación es una sub-matriz que se obtiene al mapear dos altavoces asimétricos (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4). La segunda sub-matriz de la Fig. 8B se refiere al mapeo de dos
45 canales de entrada simétricos con un canal de salida asimétrico que, en la realización de la Fig. 4 es, por ejemplo, el mapeo de los dos canales de entrada simétricos LFE y LFE2 con el canal de salida LFE. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [6,11] y [6,12]. La terceras sub-matrices de la Fig. 8B representa el caso en que se corresponde un altavoz asimétrico de entrada con un par de altavoces de salida simétrico. En el caso del ejemplo no hay ningún altavoz de entrada asimétrico.
50 [0061] La Fig. 8C ilustra dos sub-matrices para el mapeo de los canales centrales con altavoces asimétricos. La primera sub-matriz mapea un altavoz central de entrada a un altavoz asimétrico de salida (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4), y la segunda sub-matriz mapea un altavoz de entrada asimétrico con un altavoz central de salida.
55 [0062] De acuerdo con esta realización, por cada grupo de altavoces de salida, se verifica si la columna
12
detenerse aquí si el nivel de precisión es 0,5 dB; -sumar el resto de los enteros múltiplos de 0,25 dB, descendiendo de 0 dB a minGain y sumar el resto de los enteros múltiplos de 0,25 dB, ascendiendo de 0,25 dB a maxGain.
5 [0067] Por ejemplo, cuando maxGain es 2 dB y minGain es -6 dB y la precisión es 0,5 dB, se genera la siguiente lista:
0, -3, -6, -1, -2, -4, -5, 1, 2, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5, 0,5, 1,5.
10 [0068] En lo que respecta a la realización anterior, cabe señalar que la invención no se limita a los valores anteriormente indicados; por el contrario, en lugar de utilizar enteros múltiplos de 3dB y a partir de 0dB, se pueden seleccionar otros valores y también se pueden seleccionar otros valores del nivel de precisión, dependiendo de las circunstancias.
15 [0069] En general, la lista de valores de ganancia se puede generar de la siguiente manera:
-sumar enteros múltiplos de un primer valor de ganancia, entre la ganancia mínima, inclusive, y un valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer valor de ganancia, entre el valor de ganancia inicial, inclusive, y la
20 ganancia máxima, inclusive, en orden creciente; -sumar el resto de los enteros múltiplos de un primer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
25 -detenerse aquí si el nivel de precisión es el primer nivel de precisión; -sumar el resto de los enteros múltiplos de un segundo nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del segundo nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
30 -detenerse aquí si el nivel de precisión es el segundo nivel de precisión; -sumar el resto de los enteros múltiplos de un tercer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente y -sumar el resto de los enteros múltiplos del tercer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente.
35 [0070] En la realización anterior, cuando el valor de ganancia inicial es cero, las partes que suman los valores restantes en orden creciente y que satisfacen la condición de multiplicidad asociada suman inicialmente el primer valor de ganancia o el primero, segundo o tercer nivel de precisión. Sin embargo, en la generalidad de los casos, las partes que suman los valores restantes en orden creciente suman inicialmente el menor valor, satisfaciendo la
40 condición de multiplicidad asociada, en el intervalo entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive. De manera correspondiente, las partes que suman los valores restantes en orden decreciente suman inicialmente el valor más grande, satisfaciendo la condición de multiplicidad asociada, en el intervalo entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive.
45 [0071] Considerando un ejemplo similar al anterior pero con un valor de ganancia inicial = 1dB (un primer valor de ganancia = 3dB, maxGain = 2dB, minGain = -6dB y un nivel de precisión = 0,5dB) da lo siguiente:
Descendente: 0, -3, -6 Ascendente: [vacío]
50 Descendente: 1, -2, -4, -5 Ascendente: 2 Descendente: 0,5, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5 Ascendente: 1,5
55 [0072] Para codificar un valor de ganancia, preferentemente se busca la ganancia en la tabla y se emite su posición dentro de la tabla. Siempre se encuentra la ganancia deseada, puesto que todas las ganancias son previamente cuantificadas al número entero más cercano múltiplo de la precisión estipulada de, por ejemplo, 1dB, 0,5dB o 0,25dB. De acuerdo con una realización preferida, las posiciones de los valores de ganancia tienen un índice asociado que indica la posición en la tabla y los índices de las ganancias pueden ser codificados, por ejemplo,
14
matriz de mezcla descendente está indicado en el flujo de bits como un valor de ganancia máxima maxGain y un valor de ganancia mínima minGain; por lo tanto no se desperdician bits en valores que no se utilizan en realidad y a la vez no se limita la flexibilidad.
5 [0077] Suponiendo que se dispone de una lista de canales de entrada y también de una lista de canales de salida que aportan información geométrica sobre cada altavoz, como por ejemplo los ángulos azimutal y de elevación y, opcionalmente, el nombre convencional del altavoz, por ejemplo de acuerdo con las referencias de la técnica anterior [6] o [7], un algoritmo para codificar una matriz de mezcla descendente, de acuerdo con las realizaciones puede ser el mostrado a continuación en la tabla 1:
10 Tabla 1 -Sintaxis de DownmixMatrix
- Sintaxis
- No. de bits Mnemónico
- DownmixMatrix(inputConfig, inputCount, outputConfig, outputCount) {
- equalizerPresent; if (equalizerPresent) { EqualizerConfig(inputConfig, inputCount); }
- 1 uimsbf
- precisionLevel; maxGain = escapedValue(3, 4, 0); minGain = escapedValue(4, 5, 0) + 1; ConvertToCompactConfig(inputConfig, inputCount); ConvertToCompactConfig(outputConfig, outputCount);
- 2 uimsbf
- isAllSeparable; if (!isAllSeparable) { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) {
- 1 uimsbf
- isSeparable[i]; } } } else { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) { isSeparable[i] = 1; } } }
- 1 uimsbf
- isAllSymmetric; if (!isAllSymmetric) { for (i = 0; i < compactOutputCount; i++) {
- 1 uimsbf
- isSymmetric[i]; } } else { for (i = 0; i < compactOutputCount; i++) { isSymmetric[i] = 1; }
- 1 uimsbf
- mixLFEOnlyToLFE;
- 1 uimsbf
- rawCodingCompactMatrix; if (rawCodingCompactMatrix) { for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (!mixLFEOnlyToLFE || (compactInputConfig[i].isLFE == compactOutputConfig[j].isLFE)) {
- 1 uimsbf
- compactDownmixMatrix[i][j];
- 1 uimsbf
16
- } else { compactDownmixMatrix[i][j] = 0; } } } } else { if (mixLFEOnlyToLFE) { compactInputLFECount = 0; compactOutputLFECount = 0; for (i = 0; i < compactInputCount; i++) { if (compactInputConfig[i].isLFE) compactInputLFECount++; } for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].isLFE) compactOutputLFECount++; } totalCount = (compactInputCount -compactInputLFECount) * (compactOutputCount -compactOutputLFECount); } else { totalCount = compactInputCount * compactOutputCount; } useCompactTemplate; n = 3; if (totalCount >= 256) n = 4; runLGRParam; count = 0; flatCompactMatrix[totalCount + 1]; while (count < totalCount) { zeroRunLength; /* limited Golomb-Rice using runLGRparam */ flatCompactMatrix[count .. count + zeroRunLength] = {0, ..., 0, 1}; count += zeroRunLength + 1; } count = 0; for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (mixLFEOnlyToLFE && compactInputConfig[i].isLFE && compactOutputConfig[j].isLFE) { compactDownmixMatrix[i][j]; } else if (mixLFEOnlyToLFE && (compactInputConfig[i].isLFE ^ compactOutputConfig[j].isLFE)) { compactDownmixMatrix[i][j] = 0; } else { compactDownmixMatrix[i][j] = flatCompactMatrix[count++]; } } } if (useCompactTemplate) { compactTemplate = FindCompactTemplate(inputConfig, inputCount, outputConfig, outputCount); for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { compactDownmixMatrix[i][j] ^= compactTemplate[i][j]; } } } } fullForAsymmetricInputs;
- 1 n varía 1 1 1 uimsbf uimsbf bslbf uimsbf uimsbf uimsbf
17
- rawCodingNonzeros; if (!rawCodingNonzeros) { gainLGRParam; generateGainTable(maxGain, minGain, precisionLevel); } for (i = 0; i < compactInputCount; i++) { iType = compactInputConfig[i].pairType; for (j = 0; j < compactOutputCount; j++) { oType = compactOutputConfig[j].pairType; i1 = compactInputConfig[i].originalPosition; o1 = compactOutputConfig[j].originalPosition; if ((iType != SYMMETRIC) && (oType != SYMMETRIC)) { downmixMatrix[i1][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); } else if (iType != SYMMETRIC) { o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); useFull = (iType == ASYMMETRIC) && fullForAsymmetricInputs; if (isSymmetric[j] && !useFull) { downmixMatrix[i1][o2] = downmixMatrix[i1][o1]; } else { downmixMatrix[i1][o2] = DecodeGainValue(); } } else if (oType != SYMMETRIC) { i2 = compactInputConfig[i].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i2][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSymmetric[j]) { downmixMatrix[i2][o1] = downmixMatrix[i1][o1]; } else { downmixMatrix[i2][o1] = DecodeGainValue(); } } else { i2 = compactInputConfig[i].SymmetricPair.originalPosition; o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; downmixMatrix[i2][o1] = 0.0; downmixMatrix[i2][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSeparable[j] && isSymmetric[j]) { downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (!isSeparable[j] && isSymmetric[j]) { downmixMatrix[i1][o2] = DecodeGainValue(); downmixMatrix[i2][o1] = downmixMatrix[i1][o2]; downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (isSeparable[j] && !isSymmetric[j]) {
- 3 uimsbf
18
- }
- eqExtendedRange; for (i = 0; i < numEqualizers; i++) { numSections = escapedValue(2, 4, 0) + 1; lastCenterFreqP10 = 0; lastCenterFreqLd2 = 10; maxCenterFreqLd2 = 99; for (j = 0; j < numSections; j++) { centerFreqP10 = lastCenterFreqP10 + ReadRange(4 -lastCenterFreqP10); if (centerFreqP10 > lastCenterFreqP10) lastCenterFreqLd2 = 10; if (centerFreqP10 == 3) maxCenterFreqLd2 = 24; centerFreqLd2 = lastCenterFreqLd2 + ReadRange(1 + maxCenterFreqLd2 -lastCenterFreqLd2); qFactorIndex; if (qFactorIndex > 19) { qFactorExtra; } cgBits = 4 + eqExtendedRange + eqPrecisionLevel; centerGainIndex; } sgBits = 4 + eqExtendedRange + min(eqPrecisionLevel + 1, 3); scalingGainIndex; } for (i = 0; i < inputCount; i++) { hasEqualizer[i]; if (hasEqualizer[i]) { equalizerIndex[i] = ReadRange(numEqualizers); } } 1 5 3 cgBits sgBits 1 uimsbf uimsbf uimsbf uimsbf uimsbf uimsbf
[0081] Los elementos de la matriz de mezcla descendente, de acuerdo con las realizaciones, pueden ser como se muestran en la siguiente tabla 5:
Tabla 5 -Elementos de DownmixMatrix
- Campo
- Descripción / Valores
- paramConfig,
- Vectores de configuración de canales que especifican la información acerca de
- inputConfig,
- cada altavoz. Cada entrada, paramConfig[i], es una estructura que consta de las
- outputConfig
- siguientes partes: -AzimuthAngle, el valor absoluto del ángulo azimutal del altavoz; -AzimuthDirection, la dirección azimutal, 0 (izquierda) o 1 (derecha); -ElevationAngle, el valor absoluto del ángulo de elevación del altavoz; -ElevationDirection, la dirección de elevación, 0 (ascendente) o 1 (descendente); -alreadyUsed, indica si el altavoz ya es parte de un grupo; -isLFE, indica si el altavoz es un altavoz LFE.
- paramCount, inputCount, outputCount
- Número de altavoces en los correspondientes vectores de configuración de canales
- compactParamConfig,
- Vectores de configuración de canales compactos que especifican la información
- compactInputConfig,
- acerca de cada grupo de altavoces. Cada entrada, compactParamConfig[i], es una
- compactOutputConfig
- estructura que consta de las siguientes partes: -pairType, tipo de grupo de altavoces, que puede ser SIMÉTRICO (un par simétrico de dos altavoces), CENTRAL o ASIMÉTRICO; -isLFE, indica si el grupo de altavoces consisten altavoces LFE; -originalPosition, posición en la configuración de canales original del primer altavoz, o único altavoz, del grupo; -symmetricPair.originalPosition, posición en la configuración de canales original
20
- del segundo altavoz del grupo, sólo para grupos SIMÉTRICOS.
- compactParamCount, compactInputCount, compactOutputCount
- Número de grupos de altavoces en los correspondientes vectores de configuración compacta de canales
- equalizerPresent
- Booleano que indica si está presente la información de ecualizador que se ha de aplicar a los canales de entrada
- precisionLevel
- Precisión usada para la cuantificación uniforme de las ganancias: 0 = 1 dB, 1 = 0,5 dB, 2 = 0,25 dB, 3 reservado
- maxGain
- Máxima ganancia real en la matriz, expresada en dB: Valores posibles de 0 a 22, en lineal 1 .. 12.589
- minGain
- Mínima ganancia real en la matriz, expresada en dB: Valores posibles de -1 a -47, en lineal 0,891 .. 0,004
- isAllSeparable
- Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de separabilidad
- isSeparable[i]
- Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de separabilidad
- isAllSymmetric
- Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de simetría
- isSymmetric[i]
- Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de simetría
- mixLFEOnlyToLFE
- Booleano que indica si los altavoces LFE se mezclan sólo con altavoces LFE y, al mismo tiempo, si los altavoces no LFE se mezclan sólo con altavoces no LFE
- rawCodingCompactMatrix
- Booleano que indica si compactDownmixMatrix es codificado raw (del inglés, crudo) (utilizando un bit por entrada) o se codifica utilizando la codificación de longitud de ejecución seguida por Golomb-Rice limitada
- compactDownmixMatrix[i][j]
- Una entrada en compactDownmixMatrix que corresponde al grupo de altavoces de entrada i y al grupo de altavoces de salida j, que indica si alguna de las ganancias asociadas es no cero: 0 = todas las ganancias son cero, 1 = al menos una ganancia es no cero
- useCompactTemplate
- Booleano que indica si se ha de aplicar una XOR por elemento a compactDownmixMatrix con una matriz plantilla compacta predefinida, para mejorar la eficacia de la codificación por longitud de ejecución
- runLGRParam
- Parámetro de Golomb-Rice Limitada utilizado para codificar las longitudes de ejecución cero en la flatCompactMatrix linealizada
- flatCompactMatrix
- Versión linealizada de compactDownmixMatrix con la matriz plantilla compacta predefinida ya aplicada; Cuando mixLFEOnlyToLFE está habilitado, esto no incluye las entradas de cero conocidas (debido a la mezcla entre no LFE y LFE) o las utilizadas para la mezcla de LFE con LFE
- compactTemplate
- Matriz plantilla compacta predefinida, que contiene entradas “típicas” que es sometida a XOR por elementos a compactDownmixMatrix, para mejorar la eficacia de codificación mediante la creación de entradas de valores principalmente de cero
- zeroRunLength
- La longitud de una ejecución cero siempre seguida por un uno, en la flatCompactMatrix, que es codificada con codificación limitada de Golomb–Rice, usando el parámetro runLGRParam
- fullForAsymmetricInputs
- Booleano que indica si se debe ignorar la propiedad de simetría por cada grupo asimétrico de altavoces de entrada; En caso de habilitarse, cada grupo asimétrico de altavoces de entrada tendrá dos valores de ganancia decodificados por cada grupo simétrico de altavoces de salida con el índice i, independientemente de isSymmetric[i]
- gainTable
- Tabla de ganancias dinámicamente generada que contiene la lista de todas las ganancias posibles entre minGain y maxGain con la precisión precisionLevel
- rawCodingNonzeros
- Booleano que indica si los valores de ganancia no cero se codifican raw (codificación uniforme, utilizando la función ReadRange) o sus índices en la lista gainTable se codifican utilizando codificación limitada de Golomb–Rice
- gainLGRParam
- Parámetro de Golomb–Rice Limitado utilizado para codificar los índices de ganancia no cero, calculado mediante la búsqueda de cada ganancia de la lista gainTable
21
Claims (1)
-
imagen1 imagen2 imagen3 imagen4 imagen5
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13189770 | 2013-10-22 | ||
EP20130189770 EP2866227A1 (en) | 2013-10-22 | 2013-10-22 | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
PCT/EP2014/071929 WO2015058991A1 (en) | 2013-10-22 | 2014-10-13 | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2655046T3 true ES2655046T3 (es) | 2018-02-16 |
Family
ID=49474267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES14783660.5T Active ES2655046T3 (es) | 2013-10-22 | 2014-10-13 | Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio |
Country Status (19)
Country | Link |
---|---|
US (5) | US9947326B2 (es) |
EP (2) | EP2866227A1 (es) |
JP (1) | JP6313439B2 (es) |
KR (1) | KR101798348B1 (es) |
CN (2) | CN110675882B (es) |
AR (1) | AR098152A1 (es) |
AU (1) | AU2014339167B2 (es) |
BR (1) | BR112016008787B1 (es) |
CA (1) | CA2926986C (es) |
ES (1) | ES2655046T3 (es) |
MX (1) | MX353997B (es) |
MY (1) | MY176779A (es) |
PL (1) | PL3061087T3 (es) |
PT (1) | PT3061087T (es) |
RU (1) | RU2648588C2 (es) |
SG (1) | SG11201603089VA (es) |
TW (1) | TWI571866B (es) |
WO (1) | WO2015058991A1 (es) |
ZA (1) | ZA201603298B (es) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
WO2016204581A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
KR102627374B1 (ko) * | 2015-06-17 | 2024-01-19 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
WO2016204579A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
JP6921832B2 (ja) * | 2016-02-03 | 2021-08-18 | ドルビー・インターナショナル・アーベー | オーディオ符号化における効率的なフォーマット変換 |
WO2017192972A1 (en) | 2016-05-06 | 2017-11-09 | Dts, Inc. | Immersive audio reproduction systems |
CN109716794B (zh) * | 2016-09-20 | 2021-07-13 | 索尼公司 | 信息处理装置、信息处理方法及计算机可读存储介质 |
US10075789B2 (en) * | 2016-10-11 | 2018-09-11 | Dts, Inc. | Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction |
US10659906B2 (en) * | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
US10979844B2 (en) * | 2017-03-08 | 2021-04-13 | Dts, Inc. | Distributed audio virtualization systems |
CN110800048B (zh) * | 2017-05-09 | 2023-07-28 | 杜比实验室特许公司 | 多通道空间音频格式输入信号的处理 |
US11089425B2 (en) * | 2017-06-27 | 2021-08-10 | Lg Electronics Inc. | Audio playback method and audio playback apparatus in six degrees of freedom environment |
JP7222668B2 (ja) * | 2017-11-17 | 2023-02-15 | 日本放送協会 | 音響処理装置及びプログラム |
BR112020012648A2 (pt) | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados |
GB2571572A (en) * | 2018-03-02 | 2019-09-04 | Nokia Technologies Oy | Audio processing |
CN115334444A (zh) * | 2018-04-11 | 2022-11-11 | 杜比国际公司 | 用于音频渲染的预渲染信号的方法、设备和系统 |
EP3874491B1 (en) | 2018-11-02 | 2024-05-01 | Dolby International AB | Audio encoder and audio decoder |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
JP7314398B2 (ja) | 2019-08-15 | 2023-07-25 | ドルビー・インターナショナル・アーベー | 変更オーディオビットストリームの生成及び処理のための方法及び装置 |
CN114303392A (zh) * | 2019-08-30 | 2022-04-08 | 杜比实验室特许公司 | 多声道音频信号的声道标识 |
WO2021113350A1 (en) | 2019-12-02 | 2021-06-10 | Dolby Laboratories Licensing Corporation | Systems, methods and apparatus for conversion from channel-based audio to object-based audio |
GB2593672A (en) * | 2020-03-23 | 2021-10-06 | Nokia Technologies Oy | Switching between audio instances |
Family Cites Families (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6108633A (en) * | 1996-05-03 | 2000-08-22 | Lsi Logic Corporation | Audio decoder core constants ROM optimization |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
US20040062401A1 (en) * | 2002-02-07 | 2004-04-01 | Davis Mark Franklin | Audio channel translation |
US6522270B1 (en) * | 2001-12-26 | 2003-02-18 | Sun Microsystems, Inc. | Method of coding frequently occurring values |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
CA2992097C (en) * | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
DE602005006777D1 (de) * | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
MX2007011915A (es) * | 2005-03-30 | 2007-11-22 | Koninkl Philips Electronics Nv | Codificacion de audio multicanal. |
WO2006108543A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
JP4988717B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
MX2007015118A (es) * | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
US7830921B2 (en) * | 2005-07-11 | 2010-11-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
US8160888B2 (en) * | 2005-07-19 | 2012-04-17 | Koninklijke Philips Electronics N.V | Generation of multi-channel audio signals |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
US9426596B2 (en) * | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
CN101506875B (zh) * | 2006-07-07 | 2012-12-19 | 弗劳恩霍夫应用研究促进协会 | 用于组合多个参数编码的音频源的设备和方法 |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
JP5254983B2 (ja) * | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
JP5220840B2 (ja) * | 2007-03-30 | 2013-06-26 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法 |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
JP5133401B2 (ja) * | 2007-04-26 | 2013-01-30 | ドルビー・インターナショナル・アクチボラゲット | 出力信号の合成装置及び合成方法 |
CN101816191B (zh) * | 2007-09-26 | 2014-09-17 | 弗劳恩霍夫应用研究促进协会 | 用于提取环境信号的装置和方法 |
CA2701360C (en) * | 2007-10-09 | 2014-04-22 | Dirk Jeroen Breebaart | Method and apparatus for generating a binaural audio signal |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
KR101147780B1 (ko) * | 2008-01-01 | 2012-06-01 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US7733245B2 (en) * | 2008-06-25 | 2010-06-08 | Aclara Power-Line Systems Inc. | Compression scheme for interval data |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
KR101392546B1 (ko) * | 2008-09-11 | 2014-05-08 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
BRPI1009467B1 (pt) * | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
ES2524428T3 (es) * | 2009-06-24 | 2014-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio |
EP2360681A1 (en) * | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
EP2686654A4 (en) * | 2011-03-16 | 2015-03-11 | Dts Inc | CODING AND PLAYING THREE-DIMENSIONAL AUDIOSPURES |
WO2012177067A2 (ko) | 2011-06-21 | 2012-12-27 | 삼성전자 주식회사 | 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기 |
EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
KR20130093798A (ko) * | 2012-01-02 | 2013-08-23 | 한국전자통신연구원 | 다채널 신호 부호화 및 복호화 장치 및 방법 |
EP2862370B1 (en) * | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
US9516446B2 (en) * | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
EP2956935B1 (en) * | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
WO2014147441A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Audio signal encoder comprising a multi-channel parameter selector |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
-
2013
- 2013-10-22 EP EP20130189770 patent/EP2866227A1/en not_active Withdrawn
-
2014
- 2014-10-13 CN CN201910973920.4A patent/CN110675882B/zh active Active
- 2014-10-13 SG SG11201603089VA patent/SG11201603089VA/en unknown
- 2014-10-13 MY MYPI2016000689A patent/MY176779A/en unknown
- 2014-10-13 WO PCT/EP2014/071929 patent/WO2015058991A1/en active Application Filing
- 2014-10-13 RU RU2016119546A patent/RU2648588C2/ru active
- 2014-10-13 BR BR112016008787-9A patent/BR112016008787B1/pt active IP Right Grant
- 2014-10-13 CN CN201480057957.8A patent/CN105723453B/zh active Active
- 2014-10-13 ES ES14783660.5T patent/ES2655046T3/es active Active
- 2014-10-13 EP EP14783660.5A patent/EP3061087B1/en active Active
- 2014-10-13 JP JP2016525036A patent/JP6313439B2/ja active Active
- 2014-10-13 KR KR1020167013337A patent/KR101798348B1/ko active IP Right Grant
- 2014-10-13 PL PL14783660T patent/PL3061087T3/pl unknown
- 2014-10-13 CA CA2926986A patent/CA2926986C/en active Active
- 2014-10-13 PT PT147836605T patent/PT3061087T/pt unknown
- 2014-10-13 MX MX2016004924A patent/MX353997B/es active IP Right Grant
- 2014-10-13 AU AU2014339167A patent/AU2014339167B2/en active Active
- 2014-10-21 TW TW103136287A patent/TWI571866B/zh active
- 2014-10-22 AR ARP140103967A patent/AR098152A1/es active IP Right Grant
-
2016
- 2016-04-18 US US15/131,263 patent/US9947326B2/en active Active
- 2016-05-16 ZA ZA2016/03298A patent/ZA201603298B/en unknown
-
2018
- 2018-03-05 US US15/911,974 patent/US10468038B2/en active Active
-
2019
- 2019-09-23 US US16/579,293 patent/US11393481B2/en active Active
-
2022
- 2022-06-15 US US17/807,095 patent/US11922957B2/en active Active
-
2024
- 2024-02-12 US US18/439,072 patent/US20240304193A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2655046T3 (es) | Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio | |
ES2930374T3 (es) | Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia | |
ES2688387T3 (es) | Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida | |
ES2667871T3 (es) | Decodificador de audio con sonoridad y metadatos de límite de programa | |
BR112015029132A2 (pt) | codificação de cenas de áudio | |
NO20180990A1 (no) | Kompatibel flerkanal-koding/dekoding. | |
ES2529219T3 (es) | Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión | |
ES2916254T3 (es) | Sonoridad de programa basada en la presentación, independiente de la transmisión | |
ES2454670T3 (es) | Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada | |
ES2641538T3 (es) | Codificación de contenido de audio multicanal | |
ES2880779T3 (es) | Método y aparato para la indexación y desindexación de cuantificación vectorial piramidal de vectores de muestra de audio/video | |
ES2645839T3 (es) | Cuantificación de parámetros no uniforme para acoplamiento avanzado | |
ES2945723T3 (es) | Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo | |
AR097012A1 (es) | Decodificador de audio, codificador de audio, método para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, método para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa de computadora usando extensión de ancho de banda | |
AR107617A1 (es) | Aparato y método para llenado estéreo en codificación multicanal | |
RU2016105468A (ru) | Многоканальный декоррелятор, многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием предварительного микширования входных сигналов декоррелятора | |
ES2560402T3 (es) | Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico | |
AR097003A1 (es) | Concepto para codificación y decodificación de audio para canales de audio y objetos de audio | |
BR112022005458A2 (pt) | Dispositivos de codificação e de decodificação de vídeo, e de produto de computador, e métodos associados | |
RU2007141938A (ru) | Энтропийное кодирование с помощью компактных кодовых книг | |
ES2903247T3 (es) | Codificación en capas y estructura de datos para representaciones comprimidas de campo sonoro o sonido ambisónico de orden superior | |
JP2016526186A (ja) | オーディオ・エンコーダおよびデコーダ | |
RU2007141936A (ru) | Кодирование информации без потерь с гарантированной максимальной битовой скоростью | |
AR113482A1 (es) | Codificadores de audio, decodificadores de audio, métodos y programas de computadora que adaptan una codificación y decodificación de bits menos significativos | |
BR112022007735A2 (pt) | Distribuição de taxa de bits em serviços de voz e áudio imersivos |