ES2327158T3 - Codificacion y decodificacion de audio. - Google Patents
Codificacion y decodificacion de audio. Download PDFInfo
- Publication number
- ES2327158T3 ES2327158T3 ES06766049T ES06766049T ES2327158T3 ES 2327158 T3 ES2327158 T3 ES 2327158T3 ES 06766049 T ES06766049 T ES 06766049T ES 06766049 T ES06766049 T ES 06766049T ES 2327158 T3 ES2327158 T3 ES 2327158T3
- Authority
- ES
- Spain
- Prior art keywords
- data
- decoder
- hierarchical
- channel
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000547 structure data Methods 0.000 claims abstract description 58
- 230000004044 response Effects 0.000 claims abstract description 29
- 239000011159 matrix material Substances 0.000 claims description 80
- 230000001174 ascending effect Effects 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 35
- 230000005236 sound signal Effects 0.000 claims description 18
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 68
- 238000011144 upstream manufacturing Methods 0.000 description 31
- 238000013459 approach Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- UHZZMRAGKVHANO-UHFFFAOYSA-M chlormequat chloride Chemical compound [Cl-].C[N+](C)(C)CCCl UHZZMRAGKVHANO-UHFFFAOYSA-M 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 235000014366 other mixer Nutrition 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Amplifiers (AREA)
Abstract
Aparato para generar un número de canales de salida de audio; comprendiendo el aparato: medios para recibir (401) un flujo de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica; medios para generar (405) la estructura de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y medios para generar (403) el número de canales de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.
Description
Codificación y decodificación de audio.
La invención se refiere a los procesos de
codificación y/o decodificación de audio que utilizan estructuras
jerárquicas de codificación y/o estructuras jerárquicas de
decodificador.
En el campo del procesamiento de audio, es bien
conocida la conversión de un número de canales de audio en otro
número más grande de canales de audio. Esta conversión puede
realizarse por diferentes razones. Por ejemplo, una señal de audio
puede convertirse en otro formato para proporcionar una experiencia
mejorada de usuario. Por ejemplo, las grabaciones tradicionales de
estéreo sólo comprenden dos canales mientras que los sistemas
avanzados modernos de audio normalmente utilizan cinco o seis
canales, como los populares sistemas de sonido envolvente 5.1. En
consecuencia, los dos canales de estéreo pueden convertirse en cinco
o seis canales con el fin de aprovechar completamente los sistemas
avanzados de audio.
Otra razón para la conversión de un canal es la
eficiencia de la codificación. Se ha encontrado que por ejemplo,
las señales de audio de estéreo pueden codificarse como señales de
audio de canal único combinadas con un flujo de bits de parámetro
que describen las propiedades espaciales de la señal de audio. El
decodificador puede reproducir las señales de audio de estéreo con
un grado muy satisfactorio de exactitud. De este modo, pueden
obtenerse ahorros sustanciales de la tasa de transmisión de
bits.
Existen varios parámetros que pueden utilizarse
para describir las propiedades espaciales de las señales de audio.
Uno de estos parámetros es la correlación cruzada entre canales, tal
como la correlación cruzada entre el canal izquierdo y el canal
derecho para las señales de estéreo. Otro parámetro es la proporción
de potencia de los canales. En los denominados codificadores
(paramétricos) de audio espacial, estos y otros parámetros se
extraen de la señal original de audio para producir una señal de
audio que tiene un número reducido de canales, por ejemplo, sólo un
canal único, más un conjunto de parámetros que describen las
propiedades espaciales de la señal original de audio. En los
denominados decodificadores (paramétricos) de audio espacial, es
reconstruida la señal original de audio.
La codificación de audio espacial es una técnica
recientemente introducida que codifica de manera eficaz el material
de audio de múltiples canales. En la codificación de audio espacial,
una señal de audio de M canales se describe como una señal de audio
de N canales más un conjunto de parámetros espaciales
correspondientes, en la que N es normalmente más pequeño que M. Por
lo tanto, la señal de M canales del codificador de audio espacial
se mezcla de forma descendente en una señal de N canales y los
parámetros espaciales se extraen. En el decodificador, la señal de
N canales y los parámetros espaciales se emplean para reconstruir
(de manera perceptible) la señal de M canales.
Preferiblemente, esta codificación de audio
espacial, según se conoce por ejemplo a partir de Herre et
al: "The reference model architecture for MPEG spatial audio
coding", Audio Engineering Society Convention Paper, 28 de mayo
de 2005, páginas 1 a 13, emplea una estructura jerárquica en cascada
o basada en árbol que comprende unidades convencionales en el
codificador y el decodificador. En el codificador, estas unidades
convencionales pueden ser mezcladores descendentes que combinan
canales en un número más bajo de canales, tales como los
mezcladores descendentes de 2-a-1,
3-a-1,
3-a-2, etc., mientras en las
correspondientes unidades convencionales del decodificador pueden
estar los canales divisores mezcladores ascendentes en un número más
alto de canales tales como los mezcladores ascendentes de
1-a-2,
2-a-3.
No obstante, un problema con un enfoque de este
tipo es que la estructura del decodificador debe coincidir con la
estructura del codificador. Aunque esto puede conseguirse mediante
el uso de una estructura normalizada de codificador y
decodificador, un enfoque de este tipo carece de flexibilidad y tenderá a originar un rendimiento por debajo del óptimo.
decodificador, un enfoque de este tipo carece de flexibilidad y tenderá a originar un rendimiento por debajo del óptimo.
Por lo tanto, sería ventajoso un sistema
mejorado y, en particular, un sistema que permita el incremento en
la flexibilidad, la reducción en la complejidad y/o la mejora del
rendimiento.
En consecuencia, la invención busca
preferiblemente mitigar, aliviar o eliminar una o más de las
desventajas mencionadas con anterioridad, solas o en
combinación.
Según un primer aspecto de la invención, se
proporciona un aparato según la reivindicación 1.
La invención puede permitir una generación
flexible de canales de audio y puede permitir en particular una
funcionalidad del decodificador para adaptarse a una estructura de
codificador utilizada para la generación del flujo de datos. La
invención puede permitir, por ejemplo, a un codificador seleccionar
un enfoque adecuado de codificación para una señal de múltiples
canales a la vez que permite que el aparato se adapte de manera
automática a la misma. La invención puede permitir un flujo de datos
que tiene una calidad mejorada de la proporción de tasa de
transmisión de bits. En particular, la invención puede permitir la
adaptación automática y/o un alto grado de flexibilidad a la vez
que proporciona la calidad mejorada de audio que puede conseguirse
a partir de las estructuras jerárquicas de
codificación/decodificación. Además, la invención puede permitir
una comunicación eficaz de la información de la estructura de
decodificador jerárquica. De manera específica, la invención puede
permitir una baja sobrecarga para los datos de estructura de árbol
de decodificador. La invención puede proporcionar un aparato que se
adapte de manera automática al flujo recibido de bits y que pueda
utilizarse con cualquier estructura jerárquica conveniente de
codificación.
Cada canal de audio puede soportar una señal
individual de audio. El flujo de datos puede ser un único flujo de
bits o por ejemplo, puede ser una combinación de una pluralidad de
un subflujos de bits distribuidos, por ejemplo, a través de
diferentes canales de distribución. El flujo de datos puede tener
una duración limitada tal como una duración fija que corresponda
con un archivo de datos de un tamaño dado. La característica de
división de canal puede ser una característica indicativa de en
cuántos canales se divide un canal de audio dado en una capa
jerárquica. Por ejemplo, la característica de división de canal
puede reflejar si un canal dado de audio no se divide o si se
divide en dos canales de audio.
Los datos de estructura de árbol de
decodificador pueden comprender datos para la estructura de
decodificador jerárquica de una pluralidad de canales de audio. De
manera específica, los datos de estructura de árbol de
decodificador pueden comprender un conjunto de datos para cada uno
del número de canales de entrada de audio. Por ejemplo, los datos
de estructura de árbol de decodificador pueden comprender datos para
una estructura de árbol de decodificador para cada señal de
entrada.
Según una característica opcional de la
invención, los datos de estructura de árbol de decodificador
comprenden una pluralidad de valores de datos, siendo cada valor de
datos indicativo de una característica de división de canal para un
canal en una capa jerárquica de la estructura de decodificador
jerárquica.
Esto puede proporcionar una comunicación eficaz
de los datos que permite que el aparato se adapte a la codificación
utilizada para el flujo de datos. Los datos de estructura de árbol
de decodificador pueden comprender, de manera específica, un valor
de datos para cada función de división de canal en la estructura de
decodificador jerárquica. Los datos de estructura de árbol de
decodificador también pueden comprender un valor de datos para cada
canal de salida que indica que no se producirán divisiones
adicionales de canal para una señal de capa jerárquica dada.
Según una característica opcional de la
invención, un valor predeterminado de datos es indicativo de la
falta de división de canal para el canal en la capa jerárquica.
Esto puede proporcionar una comunicación eficaz
de los datos que permite que el aparato se adapte, de forma
efectiva y fiable, a la codificación utilizada para el flujo de
datos.
Según una característica opcional de la
invención, un valor predeterminado de datos es indicativo de una
división de uno-a-dos canales para
el canal en la capa jerárquica.
Esto puede proporcionar una comunicación eficaz
de los datos que permite que el aparato se adapte, de forma
efectiva y fiable, a la codificación utilizada para el flujo de
datos. En particular, esto puede permitir una transferencia muy
eficaz de la información para muchos sistemas jerárquicos que
utilizan funciones de división de canal convencionales de baja
complejidad.
Según una característica opcional de la
invención, la pluralidad de valores de datos son valores de datos
binarios.
Esto puede proporcionar una comunicación eficaz
de los datos que permite que el aparato se adapte, de forma
efectiva y fiable, a la codificación utilizada para el flujo de
datos. En particular, esto puede permitir una transferencia muy
eficaz de la información para sistemas que utilizan principalmente
una funcionalidad de división de canal específica, tal como la
funcionalidad de división de
uno-a-dos canales.
Según una característica opcional de la
invención, un valor de datos binarios predeterminado es indicativo
de una división de uno-a-dos canales
y otro valor de datos binarios predeterminado es indicativo de una
falta de división de canal.
Esto puede proporcionar una comunicación eficaz
de los datos que permite que el aparato se adapte, de forma
efectiva y fiable, a la codificación utilizada para el flujo de
datos. En particular, esto puede permitir una transferencia muy
eficaz de la información para muchos sistemas basados en torno a una
funcionalidad de división de
uno-a-dos canales de baja
complejidad. Una decodificación eficaz puede conseguirse a través de
una estructura de decodificador jerárquica de baja complejidad que
puede generarse en respuesta a datos de baja complejidad. La
característica puede permitir una baja sobrecarga para la
comunicación de datos de estructura de árbol de decodificador y
puede ser particularmente adecuada para los flujos de datos
codificados a través de una simple función de codificación.
Según una característica opcional de la
invención, el flujo de datos comprende además una indicación del
número de canales de entrada.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o codificación más
eficaz de la información de la estructura de decodificador
jerárquica en los datos de estructura de árbol de decodificador. En
particular, los medios para generar la estructura de decodificador
jerárquica pueden hacer esto en respuesta a la indicación del
número de canales de entrada. Por ejemplo, en muchas situaciones
prácticas, el número de canales de entrada puede deducirse a partir
del flujo de datos, no obstante, en algunos casos especiales los
datos de audio y los datos de los parámetros pueden separarse. En
estos casos, puede ser beneficioso si el número de canales de
entrada fuera conocido puesto que los datos del flujo de datos
pueden haberse manipulado (por ejemplo, de mezclado descendente a
partir de estéreo a mono).
Según una característica opcional de la
invención, el flujo de datos comprende además una indicación del
número de canales de salida.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o puede permitir
una codificación más eficaz de la información de la estructura de
decodificador jerárquica en los datos de estructura de árbol de
decodificador. En particular, los medios para generar la estructura
de decodificador jerárquica pueden hacerlo de este modo en
respuesta a la indicación del número de canales de salida. Asimismo,
la indicación puede utilizarse como una comprobación de errores de
los datos de estructura de árbol de decodificador.
Según una característica opcional de la
invención, el flujo de datos comprende una indicación de un número
de funciones de división de
uno-a-dos canales en la estructura
de decodificador jerárquica.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o puede permitir
una codificación más eficaz de información de la estructura de
decodificador jerárquica en los datos de estructura de árbol de
decodificador. En particular, los medios para generar la estructura
de decodificador jerárquica pueden hacer esto en respuesta a la
indicación del número de funciones de división de
uno-a-dos canales en la estructura
de decodificador jerárquica.
Según una característica opcional de la
invención, el flujo de datos comprende además una indicación del
número de funciones de división de de
dos-a-tres canales en la estructura
de decodificador jerárquica.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o puede permitir
una codificación más eficaz de información de la estructura de
decodificador jerárquica en los datos de estructura de árbol de
decodificador. En particular, los medios para generar la estructura
de decodificador jerárquica pueden hacer esto en respuesta la
indicación del número de funciones de división de
dos-a-tres canales en la estructura
de decodificador jerárquica.
Según una característica opcional de la
invención, los datos de estructura de árbol de decodificador
comprenden unos datos para una pluralidad de estructuras de árbol
de decodificador ordenadas en respuesta a la presencia de una de
una funcionalidad de división de
dos-a-tres canales.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o puede permitir
una codificación más eficaz de información de la estructura de
decodificador jerárquica en los datos de estructura de árbol de
decodificador. En particular, la característica puede permitir un
rendimiento ventajoso en sistemas en los que las divisiones de
dos-a-tres canales sólo pueden
producirse en la capa raíz. Por ejemplo, los medios para generar la
estructura de decodificador jerárquica pueden en primer lugar
generar la funcionalidad de división de
dos-a-tres canales para los dos
canales de entrada seguida por la creación de la estructura restante
utilizando sólo la funcionalidad de división de
uno-a-dos canales. La estructura
restante puede generarse, de manera específica, en respuesta a los
datos binarios de la estructura de árbol de decodificador, por lo
tanto, se reduce la tasa de transmisión requerida de bits. El flujo
de datos además puede contener información del ordenamiento de la
pluralidad de estructuras de árbol de decodificador.
Según una característica opcional de la
invención, los datos de estructura de árbol de decodificador para
al menos un canal de entrada comprenden una indicación de una
función de división de dos-a-tres
canales que está presente en la capa raíz seguida por datos
binarios, en el que cada valor de los datos binarios es indicativo
de que o bien no existe funcionalidad de división o bien existe una
funcionalidad de división de
uno-a-dos canales para las capas
dependientes de la funcionalidad de división de
dos-a-tres canales.
Esto puede facilitar la decodificación y la
generación de la estructura de decodificación y/o puede permitir
una codificación más eficaz de información de la estructura de
decodificador jerárquica en los datos de estructura de árbol de
decodificador. En particular, la característica puede permitir un
rendimiento ventajoso en sistemas en los que las divisiones de
dos-a-tres canales sólo pueden
producirse en la capa raíz. Por ejemplo, los medios para generar la
estructura de decodificador jerárquica pueden en primer lugar
generar la funcionalidad de división de
dos-a-tres canales para un canal de
entrada, seguida por la generación de la estructura restante,
utilizando sólo la funcionalidad de división de
uno-a-dos canales. La estructura
restante puede generarse, de manera específica, en respuesta a los
datos binarios de la estructura de árbol de decodificador, por lo
tanto, se reduce la tasa de transmisión requerida de bits.
Según una característica opcional de la
invención, el flujo de datos comprende una indicación de la posición
del altavoz para al menos uno de los canales de salida.
Esto puede permitir una decodificación
facilitada y puede permitir un rendimiento y/o adaptación mejorada
del aparato, por lo tanto, se proporciona un incremento en la
flexibilidad.
Según una característica opcional de la
invención, los medios para generar la estructura de decodificador
jerárquica se disponen para determinar parámetros de multiplicación
para las funciones de división de canal de las capas jerárquicas en
respuesta a los datos de estructura de árbol de decodificador.
\newpage
Esto puede permitir un rendimiento mejorado y/o
una adaptación/flexibilidad mejorada. En particular, la
característica puede permitir no sólo la estructura de
decodificador jerárquica sino también la operación de las funciones
de división de canal para adaptar el flujo recibido de datos. Los
parámetros de multiplicación pueden ser parámetros de
multiplicación matricial.
Según una característica opcional de la
invención, la estructura de árbol de decodificador comprende al
menos una funcionalidad de división de canal en al menos una capa
jerárquica, comprendiendo la al menos una funcionalidad de división
de un canal: medios de decorrelación para generar una señal
decorrelacionada directamente a partir de un canal de entrada de
audio del flujo de datos; al menos una unidad de división de canal
que genera una pluralidad de canales de salida de capa jerárquica
de un canal de audio a partir de una capa jerárquica y la señal
decorrelacionada; y medios para determinar al menos una
característica del filtro de decorrelación o la unidad de división
de canal en respuesta a los datos de estructura de árbol de
decodificador.
Esto puede permitir un rendimiento mejorado y/o
la adaptación/flexibilidad mejorada. En particular, la
característica puede permitir una estructura de decodificador
jerárquica que tiene un rendimiento mejorado de decodificación y
que pueda generar canales de salida que tienen un aumento en la
calidad del audio. En particular, una estructura de decodificador
jerárquica en la que no existen señales de decorrelación son
generadas por los filtros de decorrelación en cascada pueden
conseguirse y adaptarse, dinámica y automáticamente, al flujo
recibido de datos.
El filtro de decorrelación recibe el canal de
entrada de audio del flujo de datos sin modificaciones, y de manera
específica, sin ningún filtrado anterior de la señal (tal como
mediante otro filtro de decorrelación). La ganancia del filtro de
decorrelación puede determinarse, de manera específica, en respuesta
a los datos de estructura de árbol de decodificador.
Según una característica opcional de la
invención, los medios de decorrelación comprenden unos medios de
compensación de nivel que realizan la compensación del nivel de
audio en el canal de entrada de audio para generar una señal de
audio compensada en nivel; y un filtro de decorrelación para filtrar
la señal de audio compensada en nivel para generar la señal
decorrelacionada.
Esto puede permitir una calidad mejorada y/o una
implementación facilitada.
Según una característica opcional de la
invención, los medios de compensación de nivel comprenden una
multiplicación matricial por una matriz previa. Esto puede permitir
una implementación eficaz.
Según una característica opcional de la
invención, los coeficientes de la matriz previa tienen al menos un
valor unidad para una estructura de decodificador jerárquica que
comprende sólo una funcionalidad de división de
uno-a-dos canales.
Esto puede reducir la complejidad y permitir una
implementación eficaz. La estructura de decodificador jerárquica
puede comprender otra funcionalidad diferente de la funcionalidad de
división de uno-a-dos canales aunque
según esta característica no comprenderá ninguna otra funcionalidad
de división de canal.
Según una característica opcional de la
invención, el aparato comprende además medios para determinar la
matriz previa para la al menos una funcionalidad de división de un
canal en la al menos una capa jerárquica en respuesta a parámetros
de una funcionalidad de división de canal en una capa jerárquica más
alta.
Esto puede permitir una implementación eficaz
y/o un rendimiento mejorado. La funcionalidad de división de canal
en una capa jerárquica más alta puede incluir una funcionalidad de
división de dos-a-tres canales, por
ejemplo, dispuesta en la capa raíz de la estructura de árbol de
decodificador.
Según una característica opcional de la
invención, el aparato comprende medios para determinar la matriz de
división de canal para la al menos una funcionalidad de división de
canal en respuesta a parámetros por lo menos a la funcionalidad de
división de canal en la al menos una capa jerárquica.
Esto puede permitir una implementación eficaz
y/o rendimiento mejorado. Esto puede ser particularmente ventajoso
para las estructuras jerárquicas de árbol de decodificador que
comprenden sólo la funcionalidad de división de
uno-a-dos canales.
Según una característica opcional de la
invención, el aparato comprende además medios para determinar la
matriz previa para la al menos una funcionalidad de división de
canal en la al menos una capa jerárquica en respuesta a parámetros
de un mezclador ascendente de
dos-a-tres de una capa jerárquica
más alta.
Esto puede permitir una implementación eficaz
y/o un rendimiento mejorado. Esto puede ser particularmente
ventajoso para las estructuras jerárquicas de árbol de decodificador
que comprenden una funcionalidad de división de
dos-a-tres canales en la capa raíz
de una estructura de árbol de decodificador.
Según una característica opcional de la
invención, los medios para determinar la matriz previa se disponen
para determinar la matriz previa para la al menos una funcionalidad
de división de canal en respuesta a la determinación de una primera
sub-matriz previa que corresponde a una primera
entrada del mezclador ascendente de
dos-a-tres y una segunda
sub-matriz previa que corresponde a una segunda
entrada del mezclador ascendente de
dos-a-tres.
Esto puede permitir una implementación eficaz
y/o rendimiento mejorado. Esto puede ser particularmente ventajoso
para las estructuras jerárquicas de árbol de decodificador que
comprenden una funcionalidad de división de
dos-a-tres canales en la capa raíz
de la estructura de árbol de decodificador.
Esto puede permitir una implementación eficaz
y/o rendimiento mejorado. Esto puede ser particularmente ventajoso
para las estructuras jerárquicas de árbol de decodificador que
comprenden una funcionalidad de división de
dos-a-tres canales en la capa raíz
de la estructura de árbol de decodificador.
Según otro aspecto de la invención, se
proporciona un aparato según la reivindicación 23.
Según otro aspecto de la invención, se
proporciona un flujo de datos según la reivindicación 24.
Según otro aspecto de la invención, se
proporciona un medio de almacenamiento que tiene guardado en el
mismo una señal según se describió con anterioridad.
Según otro aspecto de la invención, se
proporciona un método según la reivindicación 26.
Según otro aspecto de la invención, se
proporciona un método según la reivindicación 27.
Según otro aspecto de la invención, se
proporciona un receptor según la reivindicación 28.
Según otro aspecto de la invención, se
proporciona un transmisor según la reivindicación 29.
Según otro aspecto de la invención, se
proporciona un sistema de transmisión según la reivindicación
30.
Según otro aspecto de la invención, se
proporciona un método según la reivindicación 31
Según otro aspecto de la invención, se
proporciona un método según la reivindicación 32.
Según otro aspecto de la invención, se
proporciona un método según la reivindicación 33.
Según otro aspecto de la invención, se
proporcionan un producto de programa informático, un dispositivo de
reproducción de audio y un dispositivo de grabación de audio según
se definen en las reivindicaciones 24, 35 y 36,
respectivamente.
Estos y otros aspectos, características y
ventajas de la invención serán evidentes y se aclararán con
referencia a la(s)
realización(es) descrita(s) a continuación en el presente documento.
realización(es) descrita(s) a continuación en el presente documento.
Las realizaciones de la invención se
describirán, sólo a modo de ejemplo, con referencia a las figuras,
en las que:
\vskip1.000000\baselineskip
la figura 1 ilustra un sistema de transmisión
para la comunicación de una señal de audio según algunas
realizaciones de la invención;
la figura 2 ilustra un ejemplo de una estructura
de codificador jerárquica que puede emplearse en algunas
realizaciones de la invención;
la figura 3 ilustra un ejemplo de un codificador
según algunas realizaciones de la invención;
la figura 4 ilustra un ejemplo de un
decodificador según algunas realizaciones de la invención;
la figura 5 ilustra un ejemplo de algunas
estructuras jerárquicas de decodificador que pueden emplearse en
algunas realizaciones de la invención;
la figura 6 ilustra las estructuras jerárquicas
de decodificador de ejemplo que tienen mezcladores ascendentes de
dos-a-tres en la raíz;
la figura 7 ilustra un ejemplo de la estructura
de decodificador jerárquica que comprende una pluralidad de
estructuras de árbol de decodificador;
la figura 8 ilustra un ejemplo de un mezclador
ascendente de uno-a-dos;
la figura 9 ilustra un ejemplo de algunas
estructuras jerárquicas de decodificador que pueden emplearse en
algunas realizaciones de la invención;
la figura 10 ilustra un ejemplo de algunas
estructuras jerárquicas de decodificador que pueden emplearse en
algunas realizaciones de la invención;
la figura 11 ilustra un diagrama de flujo de
ejemplo para un método de decodificación según algunas realizaciones
de la invención;
la figura 12 ilustra un ejemplo de una
estructura matricial de decodificador según algunas realizaciones de
la invención;
la figura 13 ilustra un ejemplo de una
estructura de decodificador jerárquica que puede emplearse en
algunas realizaciones de la invención;
la figura 14 ilustra un ejemplo de una
estructura de decodificador jerárquica que puede emplearse en
algunas realizaciones de la invención; y
la figura 15 ilustra un método de transmisión y
recepción de una señal de audio según algunas realizaciones de la
invención.
\vskip1.000000\baselineskip
La siguiente descripción se centra en las
realizaciones de la invención que pueden aplicarse a la codificación
y la decodificación de una señal de audio de múltiples canales que
utiliza un número de mezcladores descendentes y mezcladores
ascendentes de canal de baja complejidad. Sin embargo, se apreciará
que la invención no se limita a esta aplicación. El experto en la
técnica entenderá que se dispone un mezclador descendente para
combinar un número de canales de audio en un número inferior de
datos paramétricos y de canales de audio adicionales, y que se
dispone un mezclador ascendente para generar un número de canales de
audio a partir de un número más bajo de datos paramétricos y de
canales de audio. Por lo tanto, el mezclador ascendente proporciona
una funcionalidad de división de canal.
La figura 1 ilustra un sistema 100 de
transmisión para la comunicación de una señal de audio según algunas
realizaciones de la invención. El sistema 100 de transmisión
comprende un transmisor 101 que se acopla a un receptor 103 a
través de una red 105, que puede ser, de manera específica,
Internet.
En el ejemplo específico, el transmisor 101 es
un dispositivo de grabación de señal y el receptor es un dispositivo
de reproducción de señal 103 aunque se apreciará que en otras
realizaciones el transmisor y el receptor pueden utilizarse en
otras aplicaciones y para otros propósitos. Por ejemplo, el
transmisor 101 y/o el receptor 103 pueden ser parte de una
funcionalidad de transcodificación y pueden proporcionar, por
ejemplo, la interconexión con otras fuentes o destinos de
señal.
En el ejemplo específico en el que se soporta
una función de grabación de señal, el transmisor 101 comprende un
digitalizador 107 que recibe una señal analógica que se convierte en
una señal PCM digital mediante muestreo y conversión de analógica a
digital.
El transmisor 101 se acopla al codificador 109
de la figura 1, que codifica la señal PCM según un algoritmo de
codificación. El codificador 100 se acopla a un transmisor 111 de
red que recibe la señal codificada y se interconecta a Internet
105. El transmisor de red puede enviar la señal codificada al
receptor 103 a través de Internet 105.
El receptor 103 comprende un receptor 113 de red
que se interconecta a Internet 105 y que se dispone para recibir la
señal codificada del transmisor 101.
El receptor 111 de red se acopla a un
decodificador 115. El decodificador 115 recibe la señal codificada y
la decodifica según un algoritmo de decodificación.
En el ejemplo específico en el que se soporta
una función de reproducción de señal, el receptor 103 comprende
además un reproductor 117 de señal que recibe la señal decodificada
de audio del decodificador 115 y la presenta al usuario. De manera
específica, el reproductor de señal 113 puede comprender un
convertidor de digital a analógico, amplificadores y altavoces
según se requiera para dar salida a la señal decodificada de
audio.
En el ejemplo de la figura 1, el codificador 109
y el decodificador 115 utilizan una estructura en cascada o basada
en árbol que consiste en pequeños bloques de construcción. Por lo
tanto, el codificador 109 utiliza una estructura jerárquica de
codificación en la que los canales de audio se procesan de forma
progresiva en diferentes capas de la estructura jerárquica. Una
estructura de este tipo puede conducir a una codificación
particularmente ventajosa con una alta calidad de audio, aunque
relativamente una complejidad baja y una implementación sencilla
del codificador 109.
La figura 2 ilustra un ejemplo de una estructura
de codificador jerárquica que puede emplearse en algunas
realizaciones de la invención.
En el ejemplo, el codificador 109 codifica una
señal de entrada de sonido envolvente de 5.1 canales que consisten
en un canal frontal izquierdo (l_{f}), un canal envolvente
izquierdo (l_{s}), un canal frontal derecho (r_{f}), un canal
central envolvente derecho (c_{o}) y un subaltavoz para graves
("subwoofer") o canal de mejora de bajas frecuencias (lfe). En
primer lugar, los canales se dividen y transforman al dominio de
frecuencia en los bloques 201 de segmentación. Las señales
resultantes del dominio de frecuencia se alimentan en pares a los
mezcladores 203 descendentes de
dos-a-uno (TTO), que realizan el
mezclado descendente de dos señales de entrada hacia un canal único
de salida y extraen los parámetros correspondientes. Por lo tanto,
los tres mezcladores 203 descendentes TTO mezclan de forma
descendente los seis canales de entrada en tres parámetros y
canales de audio.
Según se ilustra en la figura 2, las salidas de
los mezcladores 203 descendentes TTO se utilizan como entrada para
otros mezcladores 205, 207 descendentes TTO. De manera específica,
dos de los mezcladores 203 descendentes TTO se acoplan a un cuarto
mezclador 205 descendente TTO, que combina los correspondientes
canales en un canal único. El tercero de los mezcladores 203
descendentes TTO se acopla junto con el cuarto mezclador 205
descendente TTO a un quinto mezclador 207 descendente TTO que
combina los dos canales restantes en un canal único (M). Esta señal
se transforma finalmente de vuelta al dominio de tiempo, dando como
resultado un flujo m de bits de audio codificados de múltiples
canales.
Los mezcladores 203 descendentes TTO pueden
considerarse como que comprenden la primera capa de la estructura
de codificación, con una segunda capa que comprende el cuarto
mezclador 205 descendente TTO y comprendiendo la tercera capa el
quinto mezclador 207 descendente TTO. Por lo tanto, tiene lugar una
combinación de un número de canales de audio en un número más bajo
de canales de audio en cada capa de la estructura de codificador
jerárquica.
La estructura jerárquica de codificación del
codificador 109 puede originar una codificación muy eficaz y de
alta calidad de baja complejidad. Además, la estructura jerárquica
de codificación puede modificarse en función de la naturaleza de la
señal que se codifica. Por ejemplo, si se codifica una señal de
estéreo simple, esto puede conseguirse a través de la estructura
jerárquica de codificación que sólo comprende un mezclador
descendente TTO único y una capa única.
Con el fin de que el decodificador 115 maneje
las señales codificadas utilizando diferentes estructuras
jerárquicas de codificación, éste debe poder adaptarse a la
estructura jerárquica de codificación utilizada para la señal
específica. De manera específica, el decodificador 115 comprende la
funcionalidad para la configuración por sí mismo de manera que
tiene una estructura de decodificador jerárquica que coincide con la
estructura jerárquica de codificación del codificador 109. No
obstante, con el fin de hacer esto, debe dotarse al decodificador
115 de información de la estructura jerárquica de codificación
utilizada para la codificación del flujo recibido de bits.
La figura 3 ilustra un ejemplo del codificador
109 según algunas realizaciones de la invención.
El codificador 109 comprende un procesador 301
de recepción que recibe un número de canales de entrada de audio.
Para el ejemplo específico de la figura 2, el codificador 109 recibe
seis canales de entrada. El procesador 301 de recepción se acopla a
un procesador 303 de codificación que tiene una estructura
jerárquica de codificación. Como ejemplo, la estructura jerárquica
de codificación del procesador 303 de codificación puede
corresponder a la que se ilustra en la figura 2.
El procesador 303 de codificación se acopla
además a un procesador 305 de estructura de codificación que se
dispone para determinar la estructura jerárquica de codificación
utilizada por el procesador 303 de codificación. El procesador 303
de codificación puede alimentar, de manera específica, los datos de
estructura al procesador 305 de estructura de codificación. Como
respuesta, el procesador 305 de estructura de codificación genera
los datos de estructura de árbol de decodificador que son
indicativos de la estructura de decodificador jerárquica que debe
utilizar el decodificador para decodificar la señal codificada que
generada el procesador 303 de codificación.
Se apreciará que los datos de estructura de
árbol de decodificador pueden determinarse directamente como datos
que describen la estructura jerárquica de codificación o por
ejemplo, pueden ser los datos que describen directamente la
estructura de decodificador jerárquica que debe utilizarse (por
ejemplo, pueden describir la estructura complementaria a la del
procesador 303 de codificación).
Los datos de estructura de árbol de
decodificador comprenden, de manera específica, al menos un valor de
datos indicativo de una característica de división de canal para un
canal de audio en las capas jerárquicas de la estructura de
decodificador jerárquica. Por lo tanto, los datos de estructura de
árbol de decodificador pueden comprender al menos una indicación de
dónde tiene que dividirse un canal de audio en el decodificador.
Esta indicación puede ser, por ejemplo, una indicación de una capa
en la que la estructura de codificación comprende un mezclador
descendente o puede ser, de manera equivalente, una indicación de
una capa de una estructura de árbol de decodificador que debe
comprender un mezclador ascendente.
El procesador 303 de codificación y el
procesador 305 de estructura de codificación se acoplan al generador
307 de flujo de datos, que crea un flujo de bits que comprende el
audio codificado del procesador de estructura 303 de codificación y
los datos de estructura de árbol de decodificador que provienen del
procesador 305 de estructura de codificación. A continuación, el
flujo de datos se alimenta al transmisor 111 de red para su
comunicación con el receptor 103.
La figura 4 ilustra un ejemplo del decodificador
115 según algunas realizaciones de la invención.
El decodificador 115 comprende un receptor 401
que recibe el flujo de datos transmitido desde el receptor 113 de
red. El decodificador 115 comprende además un procesador 403 de
decodificación y un procesador 405 de estructura de decodificador
acoplado al receptor 401.
El receptor 401 extrae los datos de estructura
de árbol de decodificador y los alimenta al procesador 405 de
estructura de decodificador mientras que los datos de codificación
de audio que comprenden un número de canales de audio y los datos
paramétricos de audio se alimentan al procesador 403 de
decodificación.
El procesador 405 de estructura de decodificador
se dispone para determinar la estructura de decodificador
jerárquica en respuesta a los datos recibidos de estructura de árbol
de decodificador. De manera específica, el procesador 405 de
estructura de decodificador puede extraer los valores de datos que
especifican las divisiones de datos y puede generar la información
de la estructura de decodificador jerárquica que complementa la
estructura jerárquica de codificación del procesador 303 de
codificación. Esta información se alimenta al procesador 403 de
decodificación haciendo que se configure para una estructura de
decodificador jerárquica específica.
De manera subsiguiente, el procesador 405 de
estructura de decodificador continúa generando los canales de
salida que corresponden a las entradas originales al codificador 109
utilizando la estructura de decodificador jerárquica.
Por lo tanto, el sistema puede permitir una
codificación, decodificación y distribución eficaz y de alta calidad
de las señales de audio y de manera específica, de las señales de
audio de múltiples canales. Se permite un sistema muy flexible, en
el que los decodificadores pueden adaptarse, de manera automática, a
los codificadores y los mismos decodificadores pueden utilizarse de
este modo con un número de codificadores diferentes.
Los datos de estructura de árbol de
decodificador se comunican de manera efectiva utilizando valores de
datos que son indicativos de las características de división de
canal para los canales de audio en diferentes capas jerárquicas de
la estructura de decodificador jerárquica. Por lo tanto, los datos
de estructura de árbol de decodificador se optimizan para
estructuras flexibles y de alto rendimiento de codificación y
decodificación jerárquica.
Por ejemplo, una señal de 5.1 canales (es decir,
una señal de seis canales) puede codificarse como una señal de
estéreo más un conjunto de parámetros espaciales. Esta codificación
puede conseguirse a través de muchas estructuras jerárquicas de
codificación diferentes que utilizan mezcladores descendentes TTO o
de dos-a-tres (TTT) simples y por
lo tanto, muchas estructuras jerárquicas de decodificador diferentes
son posibles utilizando mezcladores ascendentes de
uno-a-dos (OTT) o de
dos-a-tres (TTT). Por lo tanto, con
el fin de decodificar el correspondiente flujo de bits espacial, el
decodificador debe tener conocimiento de la estructura jerárquica
de codificación que ha sido empleada en el codificador. Un enfoque
directo es entonces señalar el árbol en el flujo de bits por medio
de un índice en una tabla de consulta. Un ejemplo de una tabla de
consulta adecuada puede ser:
Sin embargo, la utilización de esta tabla de
consulta tiene la desventaja que todas las estructuras jerárquicas
de codificación que posiblemente pueden utilizarse deben
especificarse de manera explícita en la tabla de consulta. Sin
embargo, esto requiere que todos los decodificadores/codificadores
reciban tablas actualizadas de consulta con el fin de introducir
una nueva estructura jerárquica de codificación al sistema. Esto en
gran medida es indeseable y da como resultado una operación
compleja y un sistema carente de flexibilidad.
En contraste, el uso de los datos de estructura
de árbol de decodificador en los que los valores de datos indican
las divisiones de canal en las diferentes capas de la estructura de
decodificador jerárquica permite una comunicación general simple de
los datos de estructura de árbol de decodificador que pueden
describir cualquier estructura de decodificador jerárquica. Por lo
tanto, pueden utilizarse con facilidad nuevas estructuras de
codificación sin requerir ninguna notificación anterior de los
decodificadores correspondientes.
Por lo tanto, en contraste con el enfoque basado
en la consulta, el sistema de la figura 1 puede manejar un número
arbitrario de canales de entrada y salida, a la vez que mantiene una
total flexibilidad. Esto se consigue mediante la especificación de
una descripción del árbol de codificador/decodificador en el flujo
de bits. A partir de esta descripción, el decodificador puede
deducir en dónde y cómo aplicar los subsiguientes parámetros
codificados en el flujo de bits.
Los datos de estructura de árbol de
decodificador pueden comprender, de manera específica, una
pluralidad de valores de datos, en los que cada valor de datos es
indicativo de una característica de división de canal para un canal
en una capa jerárquica de la estructura de decodificador jerárquica.
De manera específica, los datos de estructura de árbol de
decodificador pueden comprender un valor de datos para cada
mezclador ascendente que será incluido en la estructura de
decodificador jerárquica. Además, un valor de datos puede ser
incluido para cada canal, que no será dividido. Por lo tanto, si un
valor de datos de los datos de estructura de árbol de decodificador
tuviera un valor que corresponde a un valor predeterminado
específico de datos, esto puede indicar que el canal
correspondiente no será dividido aunque de hecho es un canal de
salida del decodificador 115.
En algunas realizaciones, el sistema sólo puede
incorporar codificadores que utilizan, de manera exclusiva,
mezcladores descendentes TTO y el decodificador puede implementarse
en consecuencia utilizando sólo mezcladores ascendentes OTT. En
esta realización, un valor de datos puede ser incluido para cada
canal del decodificador. Además, el valor de datos puede tomar uno
de dos posibles valores indicando un valor que el canal no se divide
e indicando el otro valor que el canal se divide en dos canales por
un mezclador ascendente OTT. Además, el orden de los valores de
datos en los datos de estructura de árbol de decodificador puede
indicar qué canales se dividirán y por lo tanto, la ubicación de
los mezcladores ascendentes OTT en la estructura de decodificador
jerárquica. Por lo tanto, pueden conseguirse los datos de estructura
de árbol de decodificador que comprenden valores binarios simples,
que describen completamente la estructura de decodificador
jerárquica requerida.
Como ejemplo específico, se describirá la
deducción de la descripción de la secuencia de bits de la estructura
de decodificador jerárquica del decodificador de la figura 5.
En el ejemplo, se supone que los codificadores
sólo pueden utilizar mezcladores descendentes TTO y por lo tanto,
el árbol de decodificador puede describirse mediante una secuencia
binaria. En el ejemplo de la figura 5, un canal único de entrada de
audio se expande a una señal de salida de cinco canales que utiliza
mezcladores ascendentes OTT. En el ejemplo, pueden discernirse
cuatro capas de profundidad, la primera, denotada con 0, se
encuentra en la capa de la señal de entrada, la última, denotada con
3, se encuentra en la capa de las señales de salida. Se apreciará
que en esta descripción, las capas se caracterizan por los canales
de audio con los mezcladores ascendentes que forman los límites de
capa, las capas pueden igualmente considerarse como que comprenden
o están formadas por los mezcladores ascendentes.
En el ejemplo, la estructura de decodificador
jerárquica de la figura 5 puede describirse mediante la secuencia
de bits "111001000" deducida de las siguientes etapas.
\vskip1.000000\baselineskip
1 - La señal de entrada en la capa 0, t_{0},
se divide (mezclador ascendente OTT), como resultado, todas las
señales en la capa 0 se tienen en cuenta, continúese con la capa
1.
1 - La primera señal en la capa 1 (que proviene
de la parte superior del mezclador ascendente OTT A) se divide
(mezclador ascendente OTT B).
1 - La segunda señal en la capa 1 (que proviene
de la parte inferior del mezclador ascendente OTT A) se divide
(mezclador ascendente OTT C), todas las señales en la capa 1 se
describen, y continúese con la capa 2.
0 - La primera señal en la capa 2 (parte
superior del mezclador ascendente OTT B) no se divide más.
0 - La segunda señal en la capa 2 (parte
inferior del mezclador ascendente OTT B) no se divide más.
1 - La tercera señal en la capa 2 (parte
superior del mezclador ascendente OTT C) se divide de nuevo.
0 - La cuarta señal en la capa 2 (parte inferior
del mezclador ascendente OTT D) no se divide más, todas las señales
en la capa 2 se describen, continúese con la capa 3.
0 - La primera señal en la capa 3 (parte
superior del mezclador ascendente OTT D) no se divide más.
0 - La segunda señal en la capa 3 (parte
inferior del mezclador ascendente OTT D) no se divide más, todas
las señales se han descrito.
\vskip1.000000\baselineskip
En algunas realizaciones, la codificación puede
limitarse sólo a la utilización de los mezcladores descendentes TTO
y TTT y por lo tanto, la decodificación puede limitarse sólo a la
utilización de los mezcladores ascendentes OTT y TTT. Aunque los
mezcladores ascendentes TTT pueden utilizarse en muchas
configuraciones diferentes, es particularmente ventajosa su
utilización en un modo en el que la predicción (forma de onda) se
utilizase para estimar con exactitud las tres señales de salida que
provienen de las dos señales de entrada. Debido a esta naturaleza
predictiva de los mezcladores ascendentes TTT, la posición lógica
para estos mezcladores ascendentes se encuentra en la raíz del
árbol. Esto es una consecuencia de que los mezcladores ascendentes
OTT destruyen la forma de onda original, con lo que hacen inadecuada
la predicción. Por lo tanto, en algunas realizaciones, los únicos
mezcladores ascendentes que se utilizan en la estructura de
decodificador son los mezcladores ascendentes OTT o los mezcladores
ascendentes TTT en la capa raíz.
Por lo tanto, para estos sistemas, pueden
discernirse tres diferentes situaciones que juntas permiten una
descripción universal del árbol:
1) árboles que tienen un mezclador ascendente
TTT como raíz.
2) árboles que consisten sólo en mezcladores
ascendentes OTT.
3) "árboles vacíos", es decir, un mapeo
directo de el (los) canal(es) de entrada a el (los) de
salida.
\vskip1.000000\baselineskip
La figura 6 ilustra las estructuras jerárquicas
de decodificador de ejemplo que tienen mezcladores ascendentes TTT
en la raíz, y la figura 7 ilustra una estructura de decodificador
jerárquica de ejemplo que comprende una pluralidad de estructuras
de árbol de decodificador. La estructura de decodificador jerárquica
de la figura 7 comprende estructuras de árbol de decodificador
según todos los tres ejemplos presentados con anterioridad.
En algunas realizaciones, los datos de
estructura de árbol de decodificador se ordenan con el fin de saber
si el canal de entrada comprende un mezclador ascendente TTT o no.
Los datos de estructura de árbol de decodificador pueden comprender
una indicación de que un mezclador ascendente TTT está presente en
la capa raíz seguido por datos binarios indicativos de si los
canales de las capas inferiores se dividen por el mezclador
ascendente OTT o no se dividen más. Esto puede mejorar el
rendimiento en términos de tasa de transmisión de bits y bajos
costes de señalización.
Por ejemplo, los datos de estructura de árbol de
decodificador pueden indicar cuántos mezcladores ascendentes TTT
están incluidos en la estructura de decodificador jerárquica. Puesto
que cada estructura de árbol sólo puede incluir un mezclador
ascendente TTT que esté dispuesto en el nivel de raíz, el resto del
árbol puede describirse mediante una secuencia binaria según se
describió con anterioridad (es decir, puesto que el árbol es un
árbol mezclador ascendente OTT sólo para las capas inferiores, puede
aplicarse el mismo enfoque según se describió para la estructura de
decodificador jerárquica sólo de mezclador ascendente OTT).
Asimismo, las estructuras restantes de árbol
son, o bien árboles sólo de mezclador ascendente OTT o bien árboles
vacíos que también pueden describirse mediante secuencias binarias.
Por lo tanto, todos los árboles pueden describirse mediante valores
de datos binarios y la interpretación de la secuencia binaria puede
depender de la categoría a la que pertenece el árbol. Esta
información puede proporcionarse mediante la ubicación del árbol en
los datos de estructura de árbol de decodificador. Por ejemplo,
todos los árboles que comprenden un mezclador ascendente TTT pueden
ubicarse en primer lugar en los datos de estructura de árbol de
decodificador, seguidos por los árboles sólo de mezclador
ascendente OTT, seguido por los árboles vacíos. Si el número de
mezcladores ascendentes TTT y mezcladores ascendentes OTT en la
estructura de decodificador jerárquica se incluye en los datos de
estructura de árbol de decodificador, el decodificador puede
configurarse sin requerir ningún dato adicional. Por lo tanto, se
consigue una comunicación altamente eficaz de la información de la
estructura requerida del decodificador. La sobrecarga de la
comunicación de los datos de estructura de árbol de decodificador
puede mantenerse muy baja, proporcionando no obstante un sistema
flexible en gran medida, que puede describir una amplia variedad de
estructuras jerárquicas de decodificador.
Como ejemplo específico, las estructuras
jerárquicas de decodificador del decodificador de la figura 7 pueden
deducirse a partir de los datos de estructura de árbol de
decodificador a través de los siguientes procesos:
- -
- El número de señales de entrada se deduce del mezclado descendente (posiblemente codificado).
- -
- El número de mezcladores ascendentes OTT y el número de mezcladores ascendentes TTT de la totalidad del árbol se señalizan en los datos de estructura de árbol de decodificador y pueden extraerse de los mismos. El número de señales de salida puede deducirse como: #señales de salida = #señales de entrada +#mezcladores ascendentes TTT + #mezcladores ascendentes OTT.
- -
- Los canales de entrada pueden mapearse nuevamente en los datos de estructura de árbol de decodificador de manera que después de un nuevo mapeo los árboles según la situación 1) se encuentran en primer lugar, seguidos por los árboles según la situación 2) y posteriormente, 3). Para el ejemplo de la figura 7 esto daría como resultado el orden 3, 0, 1, 2, 4, es decir, la señal 0 es la señal 3 después del nuevo mapeo, la señal 1 es la señal 0 después del nuevo mapeo, etcétera.
- -
- Para cada mezclador ascendente TTT, tres descripciones de árbol sólo de OTT se dan utilizando el método descrito con anterioridad, un árbol sólo de OTT por canal de salida TTT.
- -
- Para todas las señales restantes de entrada se dan descripciones sólo de OTT.
\vskip1.000000\baselineskip
En algunas realizaciones, se incluye una
indicación de la posición del altavoz para los canales de salida en
los datos de estructura de árbol de decodificador. Por ejemplo,
puede utilizarse una tabla de consulta de las ubicaciones
predeterminadas de altavoz, tal como por ejemplo:
De forma alterna, las ubicaciones de altavoz
pueden representarse utilizando un enfoque jerárquico. Por ejemplo,
unos primeros pocos bits especifican el eje-x, por
ejemplo, L, R, C, después, otros pocos bits especifican el
eje-y, por ejemplo, frontal, lateral y envolvente, y
otros pocos bits especifican el eje-z
(elevación).
Como ejemplo específico, lo siguiente
proporciona una sintaxis de ejemplo de flujo de bits para un flujo
de bits seguido por los principios descritos con anterioridad. En
el ejemplo, el número de señales de entrada y de salida se
codifica, de manera explícita, en el flujo de bits. Tal información
puede utilizarse para validar parte del flujo de bits.
En este ejemplo, cada árbol OttTree se maneja en
la OttTreeDescription() que se ilustra más adelante.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
En la sintaxis anterior, el formato de letras en
negrita se utiliza para indicar los elementos leídos del flujo de
bits.
Se apreciará que el concepto de las capas
jerárquicas no es necesario en esta descripción. Por ejemplo,
también puede aplicarse una descripción basada en un principio de
"con la condición de que existan extremos abiertos, existirán más
bits por llegar". Con el fin de decodificar los datos, este
concepto puede volverse útil.
Aparte de los bits únicos que denotan si un
mezclador ascendente OTT está presente o no, se incluyen los
siguientes datos para el mezclador ascendente OTT:
- -
- la diferencia de nivel de canal por defecto.
- -
- Si el mezclador ascendente OTT es un mezclador ascendente OTT LFE (mejora de bajas frecuencias), es decir, si los parámetros están limitados sólo por banda y no contienen ningún tipo de datos de correlación/coherencia.
\vskip1.000000\baselineskip
Además, los datos pueden detallar las
propiedades específicas de los mezcladores ascendentes, tal como en
el ejemplo del mezclador ascendente TTT, qué modo va a utilizarse
(predicción basada en la forma de onda, descripción basada en la
energía, etc.).
Como sabe un experto en la técnica, un mezclador
ascendente OTT utiliza una señal decorrelacionada para dividir un
canal único en dos canales. Además, la señal decorrelacionada se
deduce de la señal única de canal de entrada. La figura 8 ilustra
un ejemplo de un mezclador ascendente OTT según este enfoque. Por lo
tanto, el decodificador de ejemplo de la figura 5 puede
representarse por el diagrama de la figura 9, en el que los bloques
de decorrelacionador que generan las señales decorrelacionadas se
muestran de manera explícita.
Sin embargo, como puede observarse, este enfoque
conduce a la colocación en cascada de los bloques de
decorrelacionador, de manera que la señal decorrelacionada para el
mezclador ascendente OTT de capa más baja se genera a partir de una
señal de entrada que se ha creado a partir de otra señal
decorrelacionada. Por lo tanto, más que generarse a partir de la
señal de entrada original en el nivel de raíz, las señales
decorrelacionadas de las capas más bajas se habrán procesado a
través de varios bloques de decorrelación. Puesto que cada bloque de
decorrelación comprende un filtro de decorrelación, este enfoque
puede resultar en una "borrosidad" de la señal decorrelacionada
(por ejemplo, los transitorios pueden distorsionarse de manera
significativa). Esto da como resultado la degradación de la calidad
del audio para la señal de salida.
Por lo tanto, con el fin de mejorar la calidad
del audio, los decorrelacionadores aplicados en el mezclador
ascendente del decodificador pueden moverse en algunas
realizaciones, de manera que se evite la colocación en cascada de
las señales decorrelacionadas. La figura 10 ilustra un ejemplo de
una estructura de decodificador que corresponde a la de la figura
9, aunque con los decorrelacionadores acoplados directamente al
canal de entrada. Por lo tanto, en lugar de tomar la salida del
mezclador ascendente OTT antecesor como la entrada al
decorrelacionador, los mezcladores ascendentes de decorrelacionador
toman directamente la señal t_{0} de entrada original,
previamente procesada por los mezcladores G_{B}, G_{C} y G_{D}
ascendentes de ganancia. Estas ganancias garantizan que la potencia
a la entrada del decorrelacionador sea idéntica a la potencia que
se hubiera conseguido en la entrada del decorrelacionador en la
estructura de la figura 9. La estructura conseguida de este modo no
contiene una cascada de decorrelacionadores, con lo que se origina
una calidad mejorada del audio.
A continuación, se describirá un ejemplo de la
manera en que se determinan los parámetros de multiplicación
matricial para los mezcladores ascendentes de las capas jerárquicas
en respuesta a los datos de estructura de árbol de decodificador.
De manera particular, la descripción se centrará en las
realizaciones en las que los filtros de decorrelación para la
generación de las señales decorrelacionadas de los mezcladores
ascendentes se conectan directamente a los canales de entrada de
audio de la estructura de decodificación. Por lo tanto, la
descripción se centrará en las realizaciones de los codificadores
tal como se ilustra en la figura 10.
La figura 11 ilustra un diagrama de flujo de
ejemplo de un método de decodificación según algunas realizaciones
de la invención.
En la etapa 1101, los parámetros cuantificados y
codificados se decodifican a partir del flujo recibido de bis. Como
apreciará el experto en la técnica, esto puede originar un número de
vectores de parámetros convencionales de codificación de audio
paramétrico, tal como:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Cada vector representa los parámetros a lo largo
del eje de frecuencia.
A la etapa 1101 la sigue la etapa 1103, en la
que las matrices para los mezcladores ascendentes individuales se
determinan a partir de los datos paramétricos decodificados.
Las matrices generalizadas OTT y TTT
(independientes de la frecuencia) pueden darse, de manera
respectiva, como:
Las señales x_{i}, d_{i} e
y_{i} representan las señales de entrada, las señales
decorrelacionadas deducidas a partir de las señales x_{i}
y las señales de salida, de manera respectiva. Las entradas
H_{if} y M_{if} matriciales son funciones de los
parámetros deducidos en la etapa 1103.
A continuación, el método se divide en dos
trayectorias paralelas, en las que una trayectoria tiene como
objetivo la deducción de los valores de matriz previa del árbol
(etapa 1105) y una trayectoria tiene como objetivo la deducción de
los valores de matriz de mezclado de árbol (etapa 1107).
Las matrices previas corresponden a las
multiplicaciones matriciales aplicadas a la señal de entrada antes
de la decorrelación y la aplicación matricial. De manera específica,
las matrices previas corresponden a los mezcladores ascendentes de
ganancia aplicados en la señal de entrada antes de los filtros de
decorrelación.
En mayor detalle, una implementación de
decodificador directa conducirá en general hacia una cascada de
filtros de decorrelación, como por ejemplo, como, por ejemplo, se
aplica en la figura 9. Como se explicó con anterioridad, es
preferible evitar esta cascada. Con el fin de hacer esto, todos los
filtros de decorrelación se mueven al mismo nivel jerárquico, según
se muestra en la figura 10. Con el fin de garantizar que las señales
decorrelacionadas tienen el nivel adecuado de energía, es decir,
idéntico al nivel de la señal decorrelacionada en el caso directo
de la figura 9, las matrices previas se aplican antes de la
decorrelación.
Como ejemplo, el G_{B} de ganancia en la
figura 10 se deduce como sigue. En primer lugar, es importante
observar que el mezclador ascendente de
1-a-2 divide la potencia de la señal
de entrada hacia las salidas superior e inferior del mezclador
ascendente de 1-a-2. Esta propiedad
es reflejada en los parámetros de diferencia de intensidad entre
canales (IID) o diferencia de nivel entre canales (ICLD). Por lo
tanto, el G_{B} de ganancia se calcula como la proporción de
energía de la salida superior dividida entre la suma de las salidas
superior e inferior del mezclador ascendente de
1-a-2. Se apreciará que debido a que
los parámetros IID o ICLD pueden ser variables con el tiempo y la
frecuencia, la ganancia también puede variar tanto frente al tiempo
como frente a la frecuencia.
Las matrices de mezclado son las matrices
aplicadas a la señal de entrada por los mezcladores ascendentes con
el fin de generar los canales adicionales.
Las ecuaciones finales de matriz previa y de
mezclado son el resultado de una cascada de los mezcladores
ascendentes OTT y TTT. Puesto que la estructura del decodificador
ha sido enmendada para evitar la cascada de los decorrelacionadores,
esto debe tenerse en cuenta cuando se determinen las ecuaciones
finales.
En las realizaciones, en las que sólo se
utilizan configuraciones predeterminadas, la relación entre las
entradas H_{if} y M_{if} matriciales y las
ecuaciones finales matriciales es constante y puede aplicarse una
modificación convencional.
Sin embargo, para el enfoque más flexible y
dinámico descrito con anterioridad, la determinación de los valores
de matriz previa y mezclado puede determinarse a través de enfoques
más complejos como se describirá más adelante.
A la etapa 1105 la sigue la etapa 1109, en la
que las matrices previas deducidas en la etapa 1105 se mapean al
plan de frecuencias real que se aplica para transformar la señal de
dominio de tiempo al dominio de frecuencia (en la etapa 1113).
A la etapa 1109 la sigue la etapa 1111, en la
que puede interpolarse la interpolación de los parámetros
matriciales de frecuencia. De manera específica, puede aplicarse
interpolación en función de si la actualización temporal de los
parámetros corresponde o no a la actualización de la transformación
de tiempo a frecuencia de la etapa 1113.
En la etapa 1113, las señales de entrada se
convierten al dominio de frecuencia con el fin de aplicar las
matrices previas mapeadas y opcionalmente interpoladas.
La etapa 1115 sigue a la etapa 1111 y la etapa
1113 y comprende la aplicación de las matrices previas a las
señales de entrada del dominio de frecuencia. La aplicación real de
la matriz es un conjunto de multiplicaciones matriciales.
A la etapa 1115 la sigue la etapa 1117 en la que
parte de las señales que se originan a partir de la aplicación
matricial de la etapa 1115 se alimenta al filtro de decorrelación
para generar las señales decorrelacionadas.
El mismo enfoque se aplica para deducir las
ecuaciones de matriz de mezclado.
De manera específica, a la etapa 1107 la sigue
la etapa 1119, en la que las ecuaciones determinadas en la etapa
1107 se mapean al plan de frecuencias de la transformación de tiempo
a frecuencia de la etapa 1113.
A la etapa 1119 la sigue la etapa 1121, en la
que los valores de matriz de mezclado se interpolan, de manera
opcional, dependiendo de nuevo de la actualización temporal de los
parámetros y la transformación.
Los valores generados en las etapas 1115, 1117 y
1121 forman, por lo tanto, los parámetros requeridos para la
multiplicación matricial de mezclado ascendente y esta se realiza en
la etapa 1123.
A la etapa 1123 la sigue la etapa 1125, en la
que la salida resultante se transforma de vuelta al dominio de
tiempo.
Las etapas que corresponden a las etapas 1115,
1117 y 1123 en la figura 11 pueden ilustrarse adicionalmente
mediante la figura 12. La figura 12 ilustra un ejemplo de una
estructura de decodificador matricial según algunas realizaciones
de la invención.
La figura 12 ilustra cómo pueden utilizarse los
canales de mezclado descendente de entrada para reconstruir la
salida de múltiples canales. Como se perfiló con anterioridad, el
proceso puede describirse por las multiplicaciones matriciales con
unidades intermedias de decorrelación.
Por lo tanto, el procesamiento de los canales de
entrada para formar los canales de salida puede describirse
según:
en
donde
- \quad
- M_{1}^{n,k} es una matriz de dos dimensiones que mapea un cierto número de canales de entrada en un cierto número de canales que van hacia los decorrelacionadores, y se define por cada ranura de tiempo n, y cada subbanda k; y
- \quad
- M_{2}^{n,k} es una matriz de dos dimensiones que mapea un cierto número de canales previamente procesados en un cierto número de canales de salida, y se define para cada ranura de tiempo n, y cada subbanda híbrida k.
\vskip1.000000\baselineskip
A continuación, se describirá un ejemplo de la
manera en que pueden generarse las ecuaciones de matriz previa y
mezclado de las etapas 1105 y 1107 a partir de los datos de
estructura de árbol de decodificador.
En primer lugar, se considerarán las estructuras
de árbol de decodificador, que sólo tienen mezcladores ascendentes
OTT, con referencia al árbol de ejemplo de la figura 13.
Para este tipo de árboles es beneficioso definir
un número de variables auxiliares:
- \quad
- describe los índices del mezclador ascendente OTT que se encuentran para cada mezclador ascendente OTT (es decir, en el ejemplo la señal que está haciéndose entrar en el cuarto mezclador ascendente OTT ha pasado través del 0-ésimo y el primer mezclador ascendente OTT, según proporciona la quinta columna en la matriz Tree^{1}. De forma similar, la señal que está haciéndose entrar en el segundo mezclador ascendente OTT ha pasado a través del 0-ésimo bloque OTT, según proporciona la tercera columna en la matriz Tree^{1}, etc.).
describe si se persigue la
trayectoria superior o inferior para cada mezclador ascendente OTT.
El signo positivo indica la trayectoria superior y el signo
negativo indica la trayectoria
inferior.
\vskip1.000000\baselineskip
La matriz corresponde a la matriz Tree^{1}, y
por lo tanto, cuando una cierta columna y fila en la matriz
Tree^{1} señala a un cierto mezclador ascendente OTT, la misma
columna y fila en la matriz Tree^{1} indica si la parte inferior
o superior de este mezclador ascendente específico OTT se utiliza
para alcanzar el mezclador ascendente OTT dado en la primera fila
de la columna específica (es decir, en el ejemplo, la señal que está
haciéndose entrar en el cuarto mezclador ascendente OTT ha pasado a
través de la trayectoria superior del 0-ésimo mezclador ascendente
OTT (según se indica mediante la tercera fila, la quinta columna en
la matriz Tree^{1}_{sign}), y la trayectoria inferior
del primer mezclador ascendente OTT (como se indica mediante la
segunda fila, quinta columna en la matriz
Tree^{1}_{sign}).
Tree^{1}_{depth} = [1 2
2 3 3
]
describe la profundidad del árbol
para cada mezclador ascendente OTT (es decir, en el ejemplo el
mezclador 0 ascendente se encuentra en la capa 1, los mezcladores
ascendentes 1 y 2 se encuentran en la capa 2 y los mezcladores
ascendentes 3 y 4 se encuentran en la capa 3);
y
Tree_{elements} =
[5]
denota el número de elementos en el
árbol (es decir, en el ejemplo el árbol comprende cinco mezcladores
ascendentes).
\vskip1.000000\baselineskip
Entonces, se define una matriz temporal K_{1}
que describe la matriz previa sólo para las señales
decorrelacionadas según:
en
donde
es el valor de ganancia para el
mezclador ascendente OTT indicado por Tree^{1}(i,p)
dependiendo de si se utiliza la salida superior o la inferior del
bloque OTT, y en
donde
Los valores IID son los valores de diferencia de
intensidad entre canales obtenidos a partir del flujo de bits.
La matriz final de mezclado previo M_{1} se
construye entonces como:
Recordando que el objetivo de la matriz de
mezclado previo es poder mover los decorrelacionadores incluidos en
el mezclador ascendente OTT en la figura 13, antes que los bloques
OTT. Por lo tanto, la matriz de mezclado previo necesita
suministrar una señal de entrada "seca" para todos los
decorrelacionadores en el mezclador ascendente OTT, en donde las
señales de entrada tienen el nivel que pudieron haber tenido en el
punto específico en el árbol en el que el decorrelacionador se
dispuso antes de moverlo delante del árbol.
También, recordando que la matriz previa sólo
aplica una ganancia previa para las señales que se dirigen hacia
los decorrelacionadores y el mezclado de las señales de
decorrelacionador y la señal "seca" de mezclado descendente se
realiza en la matriz M_{2} de mezclado, que se explicará en
detalle más adelante, el primer elemento de la matriz de mezclado
previo proporciona una salida que se acopla acoplada a la matriz
M_{2} (véase la figura 12, en la que la línea m/c ilustra
esto).
Dado que actualmente está observándose un árbol
sólo de mezclador ascendente OTT, es obvio que también el segundo
elemento del vector M_{1} de mezclado previo será uno, debido a
que la señal que se dirige hacia el decorrelacionador en el
mezclador ascendente OTT cero es exactamente la señal de salida de
mezclado descendente, y que para este mezclador ascendente OTT no
existe diferencia en mover el decorrelacionador delante de todo el
árbol debido a que ya se encuentra en primer lugar en el árbol.
Además, dado que el vector de entrada a los
decorrelacionadores viene dado por v^{n,k} =
M_{1}^{n,k} x^{n,k} y observando la figura 13 y
la figura 12, y el modo en el que fueron deducidos los elementos en
la matriz M_{1}^{n,k}, es obvio que la primera fila de
M_{1} corresponde a la señal m en la figura 12, las filas
subsiguientes corresponden a la señal de entrada de
decorrelacionador del bloque 0,..., 4 OTT. Por lo tanto, el vector
W^{n,k} será como sigue:
donde e_{n} denota la
salida del decorrelacionador del n-ésimo bloque OTT en la figura
13.
\vskip1.000000\baselineskip
Ahora, observando la matriz M_{2} de mezclado,
los elementos de esta matriz pueden deducirse de forma similar. Sin
embargo, para esta matriz el objetivo es ajustar en ganancia la
señal seca y mezclarla con las salidas de decorrelacionador
relevantes. Recordando que cada mezclador ascendente OTT en el árbol
puede describirse mediante lo siguiente:
donde Y_{1} es la salida
superior del bloque OTT, e Y_{2} es la entrada inferior y
X es la señal de entrada seca y Q es la señal de
decorrelacionador.
\vskip1.000000\baselineskip
Debido a que los canales de salida están
formados por la multiplicación matricial y^{n,k} =
M_{2}^{n,k} w^{n,k} y el vector
w^{n,k} se forma como una combinación de la señal de
mezclado descendente y la salida de los decorrelacionadores según
se indica en la figura 12, cada fila de la matriz M_{2}
corresponde a un canal de salida, y cada elemento en la fila
específica, indica cuánto de la señal de mezclado descendente y de
los diferentes decorrelacionadores deberían mezclarse para formar el
canal específico de salida.
Como ejemplo, puede observarse la primera fila
de la matriz M_{2} de mezclado.
El primer elemento de la primera fila en M_{2}
corresponde a la contribución de la señal "m", y es la
contribución a la salida dada por las salidas superiores del
mezclador 0, 1 y 3 ascendente OTT. Dada la matriz anterior H, esto
corresponde a H11_{0}, H11_{1}, y H11_{3}, debido a que la
cantidad de la señal seca de la salida superior del bloque OTT es
dada por el elemento H11 del mezclador ascendente OTT.
El segundo elemento corresponde a la
contribución del decorrelacionador D1, que según lo anterior se
dispone en el mezclador 0 ascendente OTT. Por lo tanto, la
contribución de éste es H11_{0}, H11_{3} y H12_{0}. Esto es
evidente, debido a que el elemento H12_{0} proporciona al
decorrelacionador la salida del mezclador 0 ascendente OTT, y que
la señal se pasa de forma subsiguiente a través de los mezcladores 1
y 3 ascendentes OTT, como parte de la señal seca, y por lo tanto la
ganancia se ajusta según los elementos H11_{0} y H11_{3}.
De forma similar, el tercer elemento corresponde
a la contribución del decorrelacionador D2, que según lo anterior
se dispone en el mezclador 1 ascendente OTT. Por lo tanto, la
contribución de éste es H12_{0} y H11_{3}.
El quinto elemento corresponde a la contribución
del decorrelacionador D3, que según la notación anterior se dispone
en el mezclador 3 ascendente OTT. Por lo tanto, la contribución de
éste es H12_{3}.
El cuarto y el sexto elementos de la primera
fila es de cero debido a que ninguna contribución del
decorrelacionador D4 o D6 es parte del canal de salida que
corresponde a la primera fila en la matriz.
El ejemplo anterior superficial, hace evidente
que los elementos matriciales pueden deducirse como productos de
los elementos de matriz de mezclador H ascendente OTT.
Con el fin de deducir la matriz M_{2} de
mezclado para un árbol general, puede deducirse un enfoque similar
al de la matriz M_{1}. En primer lugar, se deducen las siguientes
variables auxiliares:
La matriz Tree, mantiene una columna para cada
canal de salida, describiendo los índices de los mezcladores
ascendentes OTT que debe pasar que la señal para alcanzar cada canal
de salida.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
La matriz Tree_{sign} mantiene un indicador
para cada mezclador ascendente en el árbol para señalar si debe
utilizarse la trayectoria (1) superior o (-1) inferior para
alcanzar el canal de salida actual.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
El vector Tree_{depth} mantiene el número de
mezcladores ascendentes que deben pasarse para conseguir un canal
específico de salida.
El vector Tree_{element} mantiene el número de
mezcladores ascendentes en cada sub-árbol del árbol completo
Con la condición que la notación definida con
anterioridad sea suficiente para describir todos los árboles que
pueden señalizarse, puede definirse la matriz M_{2}. La matriz
para un sub-árbol k, que crea los N canales de salida a partir de 1
canal de entrada, se define según:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
-
23
\vskip1.000000\baselineskip
donde
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
en donde los elementos H se definen
mediante los parámetros que corresponden al mezclador ascendente OTT
con índice
Tree(p,j).
A continuación, se supone un árbol más general
que involucra mezcladores ascendentes TTT en el nivel de raíz, tal
como por ejemplo, la estructura de decodificador de la figura 14.
Los mezcladores ascendentes que contienen las dos variables
M1_{i} y M2_{i} denotan los árboles OTT y por lo tanto, no
contienen necesariamente mezcladores ascendentes OTT únicos.
Además, al principio se supone que los mezcladores ascendentes TTT
no emplean una señal decorrelacionada, es decir, la matriz TTT
puede describirse como una matriz 3x2:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Según estas suposiciones y con el fin de deducir
las matrices previa y de mezclado finales para el primer mezclador
ascendente TTT, se deducen para cada árbol OTT dos conjuntos de
matrices de mezclado previo, una que describe la combinación
matricial previa para la primera señal de salida del mezclador
ascendente TTT y otra que describe la combinación matricial previa
para la segunda señal de salida del mezclador ascendente TTT.
Después de la aplicación de ambos bloques de combinación matricial
previa y de decorrelación, pueden sumarse las señales.
\newpage
Por lo tanto, las señales de salida pueden
deducirse como lo siguiente:
Finalmente, en el caso de que el mezclador
ascendente TTT pueda emplear la decorrelación, la contribución de
la señal decorrelacionada puede agregarse en forma de un proceso
posterior. Una vez que se ha deducido la señal decorrelacionada del
mezclador ascendente TTT, la contribución a cada señal de salida es
simplemente la contribución dada por el vector [M_{13}, M_{23},
M_{33}] expandido por las IDD de cada mezcladores ascendentes OTT
siguiente.
La figura 15 ilustra un método de transmisión y
recepción de una señal de audio según algunas realizaciones de la
invención.
El método se inicia en la etapa 1501, en la que
un transmisor recibe un número de canales de entrada de audio.
A la etapa 1501 la sigue la etapa 1503, en la
que el transmisor codifica de forma paramétrica el número de
canales de entrada de audio para generar el flujo de datos que
comprende el número de canales de audio y datos paramétricos de
audio.
A la etapa 1503 la sigue la etapa 1505, en la
que se determina la estructura de decodificador jerárquica que
corresponde a los medios de codificación jerárquica.
A la etapa 1505 la sigue la etapa 1507, en la
que el transmisor incluye los datos de estructura de árbol de
decodificador, que comprenden al menos un valor de datos indicativo
de una característica de división de canal para un canal de audio,
en una capa jerárquica de la estructura de decodificador jerárquica
en el flujo de datos.
A la etapa 1507 la sigue la etapa 1509, en la
que el transmisor envía el flujo de datos al receptor.
A la etapa 1509 la sigue la etapa 1511, en la
que el receptor recibe el flujo de datos.
A la etapa 1511 la sigue la etapa 1513, en la
que la estructura de decodificador jerárquica que utilizará el
receptor se determina en respuesta a los datos de estructura de
árbol de decodificador.
A la etapa 1513 la sigue la etapa 1515, en la
que el receptor genera el número de canales de salida de audio a
partir del flujo de datos, utilizando la estructura de decodificador
jerárquica.
Se apreciará que, por motivos de claridad, la
descripción anterior ha descrito las realizaciones de la invención
con referencia a las diferentes unidades y procesadores funcionales.
Sin embargo, será evidente que cualquier distribución adecuada de
funcionalidad entre las diferentes unidades o procesadores
funcionales puede utilizarse sin apartarse de la invención. Por
ejemplo, la funcionalidad ilustrada, que se realizará a través de
procesadores o controladores separados, puede efectuarse por el
mismo procesador o controladores. Por lo tanto, las referencias a
las unidades específicas funcionales sólo han de contemplarse como
referencias a los medios adecuados que proporcionan la
funcionalidad descrita más que indicativas de una estructura u
organización física o lógica estricta.
La invención puede implementarse en cualquier
forma adecuada que incluye hardware, software, firmware o cualquier
combinación de éstos. De manera opcional, la invención puede
implementarse, por lo menos parcialmente, como un software
informático que se ejecuta en uno o más procesadores de datos y/o
procesadores de señal digital. Los elementos y componentes de una
realización de la invención pueden implementarse física, funcional y
lógicamente, en cualquier forma adecuada. La funcionalidad puede,
de hecho, implementarse en una unidad única, en una pluralidad de
unidades o como parte de otras unidades funcionales. Como tal, la
invención puede implementarse en una unidad única o puede estar
distribuida física y funcionalmente entre diferentes unidades y
procesadores.
Aunque la presente invención sidote ha descrito
en conexión con algunas realizaciones, no se pretende que esté
limitada a la forma específica señalada en la presente. Más bien, el
alcance de la presente invención sólo está limitado por las
reivindicaciones que la acompañan. Además, aunque puede parecer que
una característica se describe en conexión con realizaciones
particulares, un experto en la técnica reconocerá que pueden
combinarse varias características de las realizaciones descritas
según la invención. En las reivindicaciones, el término
comprendiendo/que comprende no excluye la presencia de otros
elementos o etapas.
Además, aunque se enumeran de forma individual,
pueden implementarse una pluralidad de medios, elementos o etapas
de método, por ejemplo, por medio de una unidad o procesador único.
Además, aunque pueden incluirse características individuales en
reivindicaciones diferentes, éstas pueden combinarse posiblemente de
manera ventajosa, y la inclusión en reivindicaciones diferentes no
implica que una combinación de características no sea factible ni/o
ventajosa. También, la inclusión de una característica en una
categoría de reivindicaciones no implica una limitación a esta
categoría, sino que más bien indica que la característica es
aplicable por igual a otras categorías de reivindicación, según
proceda. Además, el orden de las características en las
reivindicaciones no implica ningún orden específico en el que las
características deben efectuarse y, en particular, el orden de las
etapas individuales en una reivindicación de método no implica que
las etapas deban realizarse en este orden. Más bien, las etapas
pueden realizarse en cualquier orden adecuado. Además, las
referencias en singular no excluyen una pluralidad. Por lo tanto,
las referencias a "un", "una", "primero",
"segundo", etc., no impiden una pluralidad. Los signos de
referencia en las reivindicaciones se proporcionan simplemente como
ejemplo aclarativo que no debe interpretarse como limitativo en modo
alguno del alcance de las reivindicaciones.
Claims (36)
1. Aparato para generar un número de canales de
salida de audio; comprendiendo el aparato:
- \quad
- medios para recibir (401) un flujo de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica;
- \quad
- medios para generar (405) la estructura de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y
- \quad
- medios para generar (403) el número de canales de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.
2. Aparato según la reivindicación 1, en el que
los datos de estructura de árbol de decodificador comprenden una
pluralidad de valores de datos, siendo cada valor de datos
indicativo de una característica de división de canal para un canal
en una capa jerárquica de la estructura de decodificador
jerárquica.
3. Aparato según la reivindicación 2, en el que
un valor predeterminado de datos es indicativo de la falta de
división de canal para el canal en la capa jerárquica.
4. Aparato según la reivindicación 2, en el que
un valor predeterminado de datos es indicativo de una división de
canal de uno-a-dos para el canal en
la capa jerárquica.
5. Aparato según la reivindicación 2, en el que
la pluralidad de valores de datos son valores de datos binarios.
6. Aparato según la reivindicación 5, en el que
un valor de datos binarios predeterminado es indicativo de una
división de canal de uno-a-dos y
otro valor de datos binarios predeterminado es indicativo de la
falta de división de canal.
7. Aparato según la reivindicación 1, en el que
el flujo de datos comprende además una indicación del número de
canales de entrada.
8. Aparato según la reivindicación 1, en el que
el flujo de datos comprende además una indicación del número de
canales de salida.
9. Aparato según la reivindicación 1, en el que
el flujo de datos comprende además una indicación de un número de
funciones de división de canal de
uno-a-dos en la estructura de
decodificador jerárquica.
10. Aparato según la reivindicación 1, en el que
el flujo de datos comprende además una indicación de un número de
funciones de división de canal de
dos-a-tres en la estructura de
decodificador jerárquica.
11. Aparato según la reivindicación 1, en el que
los datos de estructura de árbol de decodificador comprenden unos
datos para una pluralidad de estructuras de árbol de decodificador
ordenadas en respuesta a la presencia de una funcionalidad de
división de canal de dos-a-tres.
12. Aparato según la reivindicación 1, en el que
los datos de estructura de árbol de decodificador para al menos un
canal de entrada comprenden una indicación de una función de
división de canal de dos-a-tres que
está presente en la capa raíz seguida por datos binarios, en el que
cada valor de datos binarios es indicativo o bien de una falta de
funcionalidad de división o una funcionalidad de división de canal
de uno-a-dos para las capas
dependientes de la funcionalidad de división de
dos-a-tres.
13. Aparato según la reivindicación 1, en el que
el flujo de datos comprende además una indicación de una posición
de altavoz para al menos uno de los canales de salida.
14. Aparato según la reivindicación 1, en el que
los medios para generar (405) la estructura de decodificador
jerárquica se disponen para determinar parámetros de multiplicación
para las funciones de división de canal de las capas jerárquicas en
respuesta a los datos de estructura de árbol de decodificador.
15. Aparato según la reivindicación 1, en el que
la estructura de árbol de decodificador comprende al menos una
funcionalidad de división de canal en al menos una capa jerárquica,
comprendiendo la al menos una funcionalidad de división de
canal:
- \quad
- medios de decorrelación para generar una señal decorrelacionada directamente a partir de un canal de entrada de audio del flujo de datos; al menos una unidad de división de canal para generar una pluralidad de canales de salida de capa jerárquica a partir de un canal de audio de una capa jerárquica más alta y la señal decorrelacionada; y medios para determinar al menos una característica del filtro de decorrelación o la unidad de división de canal en respuesta a los datos de estructura de árbol de decodificador.
16. Aparato según la reivindicación 15, en el
que los medios de decorrelación comprenden unos medios de
compensación de nivel para realizar una compensación de nivel de
audio en el canal de entrada de audio para generar una señal de
audio compensada en nivel; y un filtro de decorrelación para filtrar
la señal de audio compensada en nivel para generar la señal
decorrelacionada.
17. Aparato según la reivindicación 16, en el
que los medios de compensación de nivel comprenden una
multiplicación matricial por una matriz previa.
18. Aparato según la reivindicación 17, en el
que los coeficientes de la matriz previa tienen al menos un valor
unidad para una estructura de decodificador jerárquica que comprende
sólo una funcionalidad de división de canal de
uno-a-dos.
19. Aparato según la reivindicación 17, que
además comprende medios para determinar la matriz previa para la al
menos una funcionalidad de división de canal en la al menos una capa
jerárquica en respuesta a parámetros de una funcionalidad de
división de canal en una capa jerárquica más alta.
20. Aparato según la reivindicación 17, en el
que el aparato comprende medios para determinar una matriz de
división de canal para la al menos una funcionalidad de división de
canal en respuesta a parámetros de la al menos una funcionalidad de
división de canal en la al menos una capa jerárquica.
21. Aparato según la reivindicación 17, que
además comprende medios para determinar la matriz previa para la al
menos una funcionalidad de división de canal en la al menos una capa
jerárquica en respuesta a parámetros de una funcionalidad de
división de canal de dos-a-tres de
una capa jerárquica más alta.
22. Aparato según la reivindicación 21, en el
que los medios para determinar la matriz previa se disponen para
determinar la matriz previa para la al menos una funcionalidad de
división de canal en respuesta a determinar una primera
sub-matriz previa que corresponde a una primera
entrada del mezclador ascendente de
dos-a-tres y una segunda
sub-matriz previa que corresponde a una segunda
entrada de un mezclador ascendente de
dos-a-tres.
23. Aparato para generar un flujo de datos que
comprende un número de canales de salida de audio, siendo el número
uno o mayor que uno, comprendiendo el aparato:
- \quad
- medios para recibir (301) un número de canales de entrada de audio;
- \quad
- medios (303) de codificación jerárquica para codificar de forma paramétrica el número de canales de entrada de audio para generar el flujo de datos que comprende el número de canales de salida de audio y datos paramétricos de audio que describen propiedades espaciales;
- \quad
- medios para determinar (305) una estructura de decodificador jerárquica que corresponde a los medios de codificación jerárquica; y
- \quad
- medios para incluir (307) datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica en el flujo de datos.
24. Flujo de datos que comprende:
- \quad
- un número de canales codificados de audio, siendo el número uno o mayor que uno;
- \quad
- datos paramétricos de audio que describen propiedades espaciales; y
- \quad
- datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica.
25. Medio de almacenamiento que tiene almacenado
en el mismo una señal según la reivindicación 24.
26. Método de generación de un número de canales
de salida de audio; comprendiendo el método:
- \quad
- recibir un flujo (1511) de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos los datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica;
- \quad
- generar la estructura (1513) de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y
- \quad
- generar el número de canales (1515) de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.
27. Método de generación de un flujo de datos
que comprende un número de canales de salida de audio, siendo el
número uno o mayor que uno, comprendiendo el método:
- \quad
- recibir (1501) un número de canales de entrada de audio;
- \quad
- codificar (1503) de forma paramétrica el número de canales de entrada de audio para generar el flujo de datos que comprende el número de canales de salida de audio y datos paramétricos de audio que describen propiedades espaciales;
- \quad
- determinar una estructura (1505) de decodificador jerárquica que corresponde a los medios de codificación jerárquica; e
- \quad
- incluir datos (1507) de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica en el flujo de datos.
28. Receptor (103) para generar un número de
canales de salida de audio; comprendiendo el receptor (103) un
aparato según la reivindicación 1.
29. Transmisor (101) para generar un flujo de
datos que comprende un número de canales de salida de audio,
comprendiendo el transmisor un aparato según la reivindicación
23.
30. Sistema de transmisión que comprende un
transmisor (101) según la reivindicación 29 y un receptor (103)
según la reivindicación 28.
31. Método de recepción de un flujo de datos,
comprendiendo el método un método según la reivindicación 26.
32. Método de transmisión de un flujo de datos
que comprende un número de canales de salida de audio, comprendiendo
el método un método según la reivindicación 27.
33. Método de transmisión y recepción de un
flujo de datos, comprendiendo el método:
- \quad
- realizar en un transmisor (101) el método según la reivindicación 32; y
- \quad
- realizar en un receptor (103) el método según la reivindicación 31.
34. Producto de programa informático adaptado
para ejecutar el método según cualquiera de las reivindicaciones
26, 27, 31, 32 y 33.
35. Dispositivo de reproducción de audio que
comprende un aparato según la reivindicación 1.
36. Dispositivo de grabación de audio que
comprende un aparato según la reivindicación 23.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05106466 | 2005-07-14 | ||
EP05106466 | 2005-07-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2327158T3 true ES2327158T3 (es) | 2009-10-26 |
Family
ID=37467582
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES09005485T Active ES2374309T3 (es) | 2005-07-14 | 2006-07-07 | Decodificación de audio. |
ES06766049T Active ES2327158T3 (es) | 2005-07-14 | 2006-07-07 | Codificacion y decodificacion de audio. |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES09005485T Active ES2374309T3 (es) | 2005-07-14 | 2006-07-07 | Decodificación de audio. |
Country Status (14)
Country | Link |
---|---|
US (1) | US7966191B2 (es) |
EP (2) | EP1902443B1 (es) |
JP (2) | JP5097702B2 (es) |
KR (2) | KR101496193B1 (es) |
CN (2) | CN101223575B (es) |
AT (2) | ATE433182T1 (es) |
BR (1) | BRPI0613469A2 (es) |
DE (1) | DE602006007139D1 (es) |
ES (2) | ES2374309T3 (es) |
HK (1) | HK1154984A1 (es) |
MX (1) | MX2008000504A (es) |
PL (2) | PL1902443T3 (es) |
RU (2) | RU2418385C2 (es) |
WO (1) | WO2007007263A2 (es) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
US7706905B2 (en) * | 2005-07-29 | 2010-04-27 | Lg Electronics Inc. | Method for processing audio signal |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
CN101361122B (zh) | 2006-04-03 | 2012-12-19 | Lg电子株式会社 | 处理媒体信号的装置及其方法 |
MX2009007412A (es) * | 2007-01-10 | 2009-07-17 | Koninkl Philips Electronics Nv | Decodificador de audio. |
US20100241434A1 (en) * | 2007-02-20 | 2010-09-23 | Kojiro Ono | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
KR101100213B1 (ko) * | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
CN102968994B (zh) * | 2007-10-22 | 2015-07-15 | 韩国电子通信研究院 | 多对象音频解码方法和设备 |
EP4293665A3 (en) * | 2008-10-29 | 2024-01-10 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
KR20110022251A (ko) * | 2009-08-27 | 2011-03-07 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
WO2011073201A2 (en) * | 2009-12-16 | 2011-06-23 | Dolby International Ab | Sbr bitstream parameter downmix |
CN102142924B (zh) * | 2010-02-03 | 2014-04-09 | 中兴通讯股份有限公司 | 一种多用途语音频编码传输方法和装置 |
SG193237A1 (en) | 2011-03-28 | 2013-10-30 | Dolby Lab Licensing Corp | Reduced complexity transform for a low-frequency-effects channel |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
EP2956935B1 (en) * | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
US9818412B2 (en) | 2013-05-24 | 2017-11-14 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
TWI634547B (zh) * | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
KR102244379B1 (ko) * | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
CN105637581B (zh) | 2013-10-21 | 2019-09-20 | 杜比国际公司 | 用于音频信号的参数重建的去相关器结构 |
EP2866475A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
EP3540732B1 (en) * | 2014-10-31 | 2023-07-26 | Dolby International AB | Parametric decoding of multichannel audio signals |
RU2019138260A (ru) * | 2015-06-24 | 2019-12-05 | Сони Корпорейшн | Устройство, способ и программа аудиообработки |
US10416954B2 (en) | 2017-04-28 | 2019-09-17 | Microsoft Technology Licensing, Llc | Streaming of augmented/virtual reality spatial audio/video |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3298478B2 (ja) * | 1997-11-10 | 2002-07-02 | 日本電気株式会社 | Mpeg復号装置 |
JPH11330980A (ja) * | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体 |
JP2001268697A (ja) * | 2000-03-22 | 2001-09-28 | Sony Corp | データ伝送システム、データ伝送装置、データ伝送方法 |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
US7613306B2 (en) * | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
ATE403217T1 (de) * | 2004-04-28 | 2008-08-15 | Matsushita Electric Ind Co Ltd | Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
JP5321820B2 (ja) * | 2009-04-23 | 2013-10-23 | セイコーエプソン株式会社 | 用紙搬送装置 |
-
2006
- 2006-07-07 AT AT06766049T patent/ATE433182T1/de not_active IP Right Cessation
- 2006-07-07 WO PCT/IB2006/052309 patent/WO2007007263A2/en active Application Filing
- 2006-07-07 ES ES09005485T patent/ES2374309T3/es active Active
- 2006-07-07 ES ES06766049T patent/ES2327158T3/es active Active
- 2006-07-07 RU RU2008105556/09A patent/RU2418385C2/ru active
- 2006-07-07 MX MX2008000504A patent/MX2008000504A/es active IP Right Grant
- 2006-07-07 PL PL06766049T patent/PL1902443T3/pl unknown
- 2006-07-07 CN CN2006800255555A patent/CN101223575B/zh active Active
- 2006-07-07 AT AT09005485T patent/ATE523877T1/de not_active IP Right Cessation
- 2006-07-07 PL PL09005485T patent/PL2088580T3/pl unknown
- 2006-07-07 CN CN2010102983019A patent/CN102013256B/zh active Active
- 2006-07-07 KR KR1020087003599A patent/KR101496193B1/ko active IP Right Grant
- 2006-07-07 US US11/995,538 patent/US7966191B2/en active Active
- 2006-07-07 JP JP2008521009A patent/JP5097702B2/ja active Active
- 2006-07-07 EP EP06766049A patent/EP1902443B1/en active Active
- 2006-07-07 KR KR1020107024547A patent/KR101492826B1/ko active IP Right Grant
- 2006-07-07 BR BRPI0613469-6A patent/BRPI0613469A2/pt not_active Application Discontinuation
- 2006-07-07 EP EP09005485A patent/EP2088580B1/en active Active
- 2006-07-07 DE DE602006007139T patent/DE602006007139D1/de active Active
-
2010
- 2010-09-08 RU RU2010137467/08A patent/RU2461078C2/ru active
- 2010-11-15 JP JP2010254409A patent/JP5269039B2/ja active Active
-
2011
- 2011-08-30 HK HK11109165.7A patent/HK1154984A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2327158T3 (es) | Codificacion y decodificacion de audio. | |
US20200304913A1 (en) | Audio decoder for audio channel reconstruction | |
ES2609449T3 (es) | Decodificación de audio | |
ES2339888T3 (es) | Codificacion y decodificacion de audio. | |
ES2312025T3 (es) | Esquema de codificador/descodificador de multicanal casi transparente o transparente. | |
ES2278348T3 (es) | Codificacion/decodificacion multicanal compatible. | |
ES2376889T3 (es) | Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal | |
ES2636808T3 (es) | Codificación de escenas de audio | |
ES2587999T3 (es) | Procedimiento, aparato y soporte de registro legible por ordenador para decodificar una señal de audio multicanal | |
ES2899286T3 (es) | Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
ES2306076T3 (es) | Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix. | |
ES2649194T3 (es) | Decodificador de audio, codificador de audio, procedimiento para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, procedimiento para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa informático que utiliza una extensión de ancho de banda | |
CN101406073B (zh) | 用于多声道音频重构中的信号成形的增强的方法 | |
ES2313646T3 (es) | Codificacion y descodificacion de audio. | |
ES2426917T3 (es) | Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado | |
ES2496571T3 (es) | Método y aparato para procesar una señal de medios | |
ES2709117T3 (es) | Codificador y decodificador de audio | |
US8626503B2 (en) | Audio encoding and decoding | |
ES2624668T3 (es) | Codificación y descodificación de objetos de audio | |
BR112017006278B1 (pt) | Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador | |
MX2008010631A (es) | Codificacion y decodificacion de audio |