ES2312025T3 - Esquema de codificador/descodificador de multicanal casi transparente o transparente. - Google Patents
Esquema de codificador/descodificador de multicanal casi transparente o transparente. Download PDFInfo
- Publication number
- ES2312025T3 ES2312025T3 ES05797659T ES05797659T ES2312025T3 ES 2312025 T3 ES2312025 T3 ES 2312025T3 ES 05797659 T ES05797659 T ES 05797659T ES 05797659 T ES05797659 T ES 05797659T ES 2312025 T3 ES2312025 T3 ES 2312025T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- multichannel
- channel
- residual
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 38
- 230000008569 process Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 description 35
- 239000003638 chemical reducing agent Substances 0.000 description 17
- 230000006872 improvement Effects 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000009194 climbing Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Error Detection And Correction (AREA)
- Dc Digital Transmission (AREA)
- Analogue/Digital Conversion (AREA)
- Glass Compositions (AREA)
- Optical Measuring Cells (AREA)
- Structure Of Printed Boards (AREA)
- Piezo-Electric Transducers For Audible Bands (AREA)
- Electroluminescent Light Sources (AREA)
- Devices For Indicating Variable Information By Combining Individual Elements (AREA)
Abstract
Un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende: un proveedor de parámetros para proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros; un codificador residual para generar una señal residual codificada en base a la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros, de tal manera que la señal de multicanal reconstruida, cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin usar la señal residual, el codificador residual incluye un descodificador de multicanal para generar una señal de multicanal descodificada utilizando el uno o más canales de mezcla descendente y el uno o más parámetros; un calculador de error para calcular una representación de señal de error de multicanal en base a la señal de multicanal descodificada y la señal de multicanal original y un procesador residual para procesar la representación de señal de error de multicanal para obtener la señal residual codificada, y un formador de corriente de datos para formar una corriente de datos que tiene la señal residual codificada y el uno o más parámetros.
Description
Esquema de codificador/descodificador de
multicanal casi transparente o transparente.
La presente invención es concerniente con
esquemas de codificación de multicanal y en particular con esquemas
de codificación de multicanal paramétricos.
Hoy en día, dos técnicas dominan el
aprovechamiento de la irrelevancia y la redundancia estéreo
contenida en las señales de audio estereofónicas. La codificación
estéreo de lado medio (M/S) [1], tiene objetivo principalmente la
remoción de redundancia y está basada en el hecho de que puesto que
los dos canales están frecuentemente bastante correlacionados, es
mejor codificar la suma y la diferencia entre los dos. Más bits
(relativamente) pueden luego ser gastados en la señal de suma de
alta potencia que en la señal de lado de baja potencia (o
diferencia). La codificación estéreo de intensidad [2, 3], por otra
parte, obtiene remoción de irrelevancia mediante, en cada
sub-banda, reemplazar las dos señales por una señal
de suma y un ángulo de azimut. En el descodificador, el parámetro
de azimut es usado para controlar la ubicación espacial del evento
auditivo representado por la señal de suma de
sub-banda. Estéreo de lado medio y estéreo de
intensidad son ambos usados extensamente en los estándares de
codificación de audio existentes [4].
Un problema con el procedimiento de M/S hacia el
aprovechamiento de redundancia, es que si los dos componentes están
fuera de fase (uno está retardado en relación con el otro), la
ganancia de codificación de M/S se desvanece. Este es un problema
conceptual, puesto que los retardos de tiempo son frecuentes en las
señales de audio reales. Por ejemplo, la audición espacial depende
mucho de las diferencias de tiempo entre las señales (especialmente
a bajas frecuencias) [5]. En las grabaciones de audio, los retardos
de tiempo se pueden derivar tanto de ajustes de micrófono
estereofónicos como de post-procesamiento artificial
(efectos de sonido). En la codificación de lado medio, una solución
ad-hoc es frecuentemente usada para la
cuestión de retardo de tiempo: la codificación de M/S es usada
solamente cuando la potencia de la señales de diferencia es menor
que un factor constante de aquel de la señal de suma [1]. El
problema de alineación es tratado mejor en [6], en donde uno de los
componentes de señal es precedido del otro. Los filtros de
predicción son derivados en una base de cuadro por cuadro en el
codificador, y son transmitidos como información lateral. En [7],
una alternativa adaptable hacia atrás es considerada. Se notará que
la ganancia de desempeño es fuertemente dependiente del tipo de
señal, pero para ciertos tipos de señales, se obtiene una ganancia
espectacular en comparación con la codificación estéreo de M/S.
La codificación estéreo paramétrica ha recibido
mucha atención últimamente [8-11]. En base a un
codificador mono de núcleo (un solo canal), tales esquemas
paramétricos extraen el componente estéreo (multicanal) y los
codifican separadamente a una velocidad de bits relativamente baja.
Esto se puede ver como una generalización de la codificación
estéreo de intensidad. Los métodos de codificación estéreo
paramétricos son particularmente útiles en el intervalo de baja
velocidad de bits de codificación de audio, en donde se tiene como
resultado un incremento significativo en la calidad de gastar
solamente una pequeña parte del presupuesto de bits totales en el
componente estéreo. Los métodos paramétricos también son atractivos
puesto que son extensibles al caso de multicanal (más de dos
canales) y tiene la habilidad de ofrecer compatibilidad hacia atrás:
surround MP3 [12] es un ejemplo en donde los datos de multicanal
son codificados y transmitidos en el campo auxiliar de la corriente
de datos. Esto permite que receptores sin capacidades de multicanal
descodifiquen una señal estéreo normal, mientras que los receptores
con capacidad surround pueden disfrutar audio de multicanal. Los
métodos paramétricos dependen frecuentemente de la extracción y
codificación de diferentes indicaciones psicoacústicas,
principalmente diferencias de nivel intercanal (ICLD) y diferencias
de tiempo intercanal (ICTD). En [11], se reporta que un parámetro
de coherencia es importante para un resultado de sonido natural. Sin
embargo, los métodos paramétricos están limitados en el sentido que
a velocidades de bit más alta, los codificadores no son aptos de
alcanzar celda transparente debido a la restricción de modelado
inherente.
Los problemas relacionados con los codificadores
de multicanal paramétricos son que su valor de calidad obtenible
máximo está limitado a un umbral, que es significativamente menor
que la calidad transparente. El umbral de calidad paramétrico es
mostrado en 1100 en la figura 11. Como se puede ver de una curva
esquemática que representa la dependencia de calidad/densidad de
bits de un mono codificador BCC mejorado (1102), la calidad no puede
cruzar el umbral de calidad paramétrico 1100 sin consideración de
la velocidad de bits. Esto significa que aún con una velocidad de
bits incrementada, la cálida de tal codificador de multicanal
paramétrico no se puede incrementar más.
El mono codificador BCC mejorado es un ejemplo
de los codificadores estéreo actualmente existentes o codificadores
de multicanal en los cuales se efectúa una mezcla descendente
estéreo o una mezcla descendente de multicanal. Adicionalmente, los
parámetros son derivados que describen relaciones de nivel
intercanal, relaciones de tiempo intercanal, relaciones de
coherencia intercanal, etc.
Los parámetros son diferentes de una señal de
forma de onda de tal manera que una señal lateral de un codificador
medio/lateral, puesto que la señal lateral describe una diferencia
entre dos canales en un formato de estilo de forma de onda en
comparación con la representación paramétrica, que describe
similaridades o disimilaridades entre dos canales al dar un cierto
parámetro en lugar de una representación de forma de onda de muestra
en muestra. En tanto que los parámetros requieren un bajo número de
bits que sean transmitidos de un codificador a un descodificador,
descripciones de forma de onda, esto es, señales residuales son
derivadas en un estilo de forma de onda requieren más bits y
permiten en principio una reconstrucción transparente.
La figura 11 muestra una dependencia de
calidad/velocidad de bits típica de tal codificador estéreo
convencional a base de forma de onda (1104). Se vuelve claro de la
figura 11 que, al incrementar la velocidad de bits más y más, la
calidad de codificador estéreo convencional tal como el codificador
estéreo medio/lateral se incrementa más y más hasta que la calidad
llega a la calidad transparente. Hay una clase de "velocidad de
bits de cruce", a la cual la curva característica 1102 para el
codificador de multicanal paramétrico y la curva 1104 para el
codificador estéreo a base de forma de onda convencional se cruzan
entre sí.
Debajo de esta velocidad de bits de cruce, el
codificador de multicanal paramétrico es mucho mejor que el
codificador estéreo convencional. Cuando la misma velocidad de bits
para ambos codificadores es considerada, el codificador de
multicanal paramétrico proporciona una calidad que es más alta que
la calidad del codificador estéreo a base de forma de onda
convencional por la diferencia de calidad 1108. En otras palabras,
cuando se desea tener una cierta calidad 1110, esta calidad puede
ser obtenida utilizando el codificador paramétrico por una
velocidad de bits que es reducida por una velocidad de bits de
diferencia 1112 en comparación con un codificador estéreo a base de
forma de onda convencional.
Por encima de la velocidad de bits de cruce, sin
embargo, la situación es completamente diferente. Puesto que el
codificador paramétrico está en su umbral 1100 de calidad de
codificador paramétrico máxima, una mejor calidad puede solamente
ser obtenida al utilizar un codificador estéreo a base de forma de
onda convencional que usa el mismo número de bits como en el
codificador paramétrico.
Es el objeto de la presente invención
proporcionar un esquema de codificación/descodificación que permita
calidad incrementada y velocidad de bits reducida en comparación con
los esquemas de codificación de multicanal existentes.
De acuerdo con el primer aspecto de la
invención, este objeto es obtenido mediante un codificador de
multicanal para codificar una señal de multicanal original que
tiene por lo menos dos canales, que comprende: proveedor de
parámetros para proporcionar uno o más parámetros, el uno o más
parámetros son formados de tal manera que una señal de multicanal
reconstruida puede ser formada utilizando uno o más canales de
mezcla descendente derivados de la señal de multicanal y el uno o
más parámetros; codificador residual para generar una señal
residual codificada en base a la señal de multicanal original, el
uno o más canales de mezcla descendente o el uno o más parámetros
de tal manera que la señal de multicanal reconstruida cuando es
formada utilizando la señal residual es más similar a la señal de
multicanal original que cuando es formada sin usar la señal
residual, el codificador residual que incluye un descodificador de
multicanal para generar una señal de multicanal descodificada
utilizando el uno o más canales de mezcla descendente y el uno o más
parámetros; un calculador de error para calcular una representación
de señal de error de multicanal en base a la señal de multicanal
descodificada y la señal de multicanal original; y un procesador
residual para procesar la representación de señal de error de
multicanal para obtener la señal residual codificada y formador de
corriente de datos para formar una corriente de datos que tiene la
señal residual codificada y el uno o más parámetros.
De acuerdo con un segundo aspecto de la presente
invención, este objeto es obtenido mediante un descodificador de
multicanal para descodificar una señal de multicanal codificada que
tiene uno o más canales de mezcla descendente, uno o más parámetros
y una señal residual codificada, el uno o más canales de mezcla
descendente dependen de un parámetro de alineación o un parámetro
de ganancia, que comprende: un descodificador residual para generar
una señal residual descodificada en base a la señal residual
codificada y un descodificador de multicanal para generar una
primera señal de multicanal reconstruida utilizando uno o más
canales de mezcla descendente y el uno o más parámetros, en donde
el descodificador de multicanal es operativo adicionalmente para
generar una segunda señal de multicanal reconstruida utilizando el
uno o más canales de mezcla descendente y la señal residual
descodificada, en donde el descodificador de multicanal es operativo
adicionalmente para ponderar el canal de mezcla descendente
utilizando el parámetro de ganancia, para agregar la señal residual
descodificada a un canal de mezcla descendente ponderado y para
ponderar otra vez un canal resultante para obtener la primera señal
de multicanal reconstruida y para restar la señal residual
descodificada del canal de mezcla descendente y ponderar un canal
resultante de la sustracción utilizando el parámetro de ganancia o
para desalinear una diferencia entre el canal de mezcla descendente
y la señal residual descodificada cuando se obtiene la segunda
señal de multicanal reconstruida.
De acuerdo con un tercer aspecto de la presente
invención, este objeto es obtenido mediante un codificador de
multicanal para codificar una señal de multicanal original que tiene
por lo menos dos canales, que comprende: un alineador de tiempo
para alinear un primer canal y un segundo canal de los por lo menos
dos canales utilizando un parámetro de alineación; un mezclador
descendente para generar un canal de mezcla descendente utilizando
los canales alineados; un calculador de ganancia para calcular un
parámetro de ganancia no igual a uno para ponderar un canal
alineado, de tal manera que la diferencia entre los canales
alineados es reducida en comparación con un valor de ganancia de
uno y un formador de corriente de datos para formar una corriente de
datos que tiene información en cuanto al canal de mezcla
descendente, información en cuanto al parámetro de alineación e
información en cuanto al parámetro de ganancia.
De acuerdo con un cuarto aspecto de la presente
invención, este objeto es obtenido mediante un descodificador de
multicanal para descodificar una señal de multicanal codificada que
tiene información en cuanto a uno o más canales de mezcla
descendente, información en cuanto a un parámetro de ganancia,
información en cuanto a un parámetro de alineación y una señal
residual codificada, que comprende: un descodificador de canal de
mezcla descendente para generar un canal de mezcla descendente
descodificado y un procesador para procesar el canal de mezcla
descendente descodificado utilizando el parámetro de ganancia para
obtener un primer un canal de salida descodificado y para procesar
el canal de mezcla descendente descodificado utilizando el parámetro
de ganancia y para desalinear utilizando el parámetro de alineación
para obtener un segundo canal de salida descodificado; y un
descodificador residual para generar una señal residual
descodificada, en donde el procesador es operativo para ponderar
principalmente el canal de mezcla descendente utilizando el
parámetro de ganancia, para agregar la señal residual descodificada
y para ponderar en segundo lugar utilizando el parámetro de ganancia
para obtener un primer canal reconstruido y para restar la señal
residual descodificada del canal de mezcla descendente antes de la
ponderación y para desalinear para obtener el segundo canal
reconstruido.
Aspectos adicionales de la presente invención
incluyen métodos correspondientes, corrientes de datos/archivos y
programas de computadora.
La presente invención está basada en el hallazgo
de que los problemas relacionados con los codificadores paramétricos
convencionales y codificadores a base de forma de onda son tratados
al combinar codificación paramétrica y codificación a base de forma
de onda. Tal codificador de la invención genera una corriente de
datos escalada que tiene, como primera capa de mejora, una
representación de parámetro codificada y que tiene, como segunda
capa de mejora, una señal residual codificada, que es
preferiblemente una señal estilo forma de onda. En general, una
señal residual adicional, que no es proporcionada en un codificador
de multicanal paramétrico puro permite mejorar la calidad obtenible
en particular entre la velocidad de bits de cruce en la figura 11 y
la calidad transparente máxima. Como se puede ver en la figura 11,
aún debajo de la velocidad de bits de cruce, el algoritmo
decodificador de la invención funciona mejor que un codificador de
multicanal paramétrico puro con respecto a calidad a velocidades de
bits comparables. En comparación con un codificador estéreo
convencional plenamente a base de forma de onda, sin embargo, el
esquema de parámetro/codificación de forma de onda/descodificación
combinado es mucho más eficiente en bits. En otras palabras, los
dispositivos de la invención combinan óptimamente las ventajas de
codificación paramétrica y codificación a base de forma de onda, de
tal manera que, aún por encima de la velocidad de bits de cruce, el
codificador de la invención se beneficia del concepto paramétrico,
pero funciona mejor que el codificador paramétrico puro.
Dependiendo de ciertas modalidades, las ventajas
de la presente invención superan al codificador paramétrico del
arte previo o codificador de multicanal a base de forma de onda
convencional más o menos. Modalidades más avanzadas proporcionan
una mejor característica de calidad/velocidad de bits, en tanto que
modalidades de bajo nivel de la presente invención requieren menos
energía de procesamiento en el lado del codificador y/o
descodificador, pero, debido a las señales residuales codificadas
adicionalmente, permiten una mejor calidad que un codificador
paramétrico puro, puesto que la calidad del codificador paramétrico
puro está limitada por la calidad de umbral 1100 en la figura
11.
El esquema de codificación/descodificación de la
invención es ventajoso en que es apto de moverse sin costuras desde
la codificación paramétrica pura a la codificación de aproxima de
forma de onda o codificación de forma de onda transparente
perfecta.
Preferiblemente, la codificación estéreo
paramétrica y codificación estéreo media/lateral son combinadas a
un esquema que tiene la habilidad de converger hacia la calidad
transparente. En este esquema relacionado con estéreo medio/lateral
preferido, la correlación entre los componentes de señal, esto es,
el canal izquierdo y el canal derecho son aprovechados más
eficientemente.
En general, la idea de la invención puede ser
aplicada en varias modalidades a un codificador de multicanal
paramétrico. En una modalidad, la señal residual es derivada de la
señal original sin usar la información de parámetros también
disponible en el codificador. Esta modalidad es preferible en
situaciones en donde la energía de procesamiento y posiblemente el
consumo de energía del procesador son una cuestión. Tal situación
puede ocurrir en dispositivos portátiles que tienen posibilidades de
energía restringida tales como teléfonos móviles, palm tops, etc.
La señal residual es solamente derivada de la señal original y no
depende de una mezcla descendente o los parámetros. Por
consiguiente, en el lado del descodificador, la primera señal de
multicanal reconstruido, que es generada utilizando el canal de
mezcla descendente y los parámetros no es usada para generar la
segunda señal de multicanal reconstruida.
No obstante, hay algo de redundancia en los
parámetros por una parte y la señal residual por otra parte. Una
redundancia-reducción puede ser obtenida mediante
otros sistemas de codificadores/descodificador que, para calcular
la señal residual codificada, hacen uso de la información de
parámetros disponible en el codificador y opcionalmente, también
del canal de mezcla descendente, que podría también estar disponible
en el codificador.
Dependiendo de la cierta situación, el
codificador residual puede ser un dispositivo de análisis mediante
síntesis que calcula una señal de multicanal reconstruida completa
utilizando el canal de mezcla descendente y la información de
parámetros. Luego, en base a la señal reconstruida, una señal de
diferencia para cada canal puede ser generada, de tal manera que se
obtiene una representación de error de multicanal, que puede ser
procesada de maneras diferentes. Una manera sería aplicar otro
esquema de codificación de multicanal paramétrico a la
representación de error de multicanal. Otra posibilidad sería
efectuar un esquema de formación de matriz para la mezcla
descendente de la representación de error de multicanal. Otra
posibilidad sería cancelar las señales de error de los canales
surround izquierdo y derecho y codificar solamente la señal de error
de canal central o además, también codificar la señal de error de
canal izquierdo y la señal de error del canal derecho.
Así, existen muchas posibilidades para
implementar un procesador residual a base de una representación de
error.
La modalidad mencionada anteriormente permite
alta flexibilidad para la codificación escalable de la señal
residual. Sin embargo, es bastante demandante en energía de
procesamiento, puesto que una reconstrucción de multicanal completa
es efectuada en el codificador y una representación de error para
cada canal de la señal de multicanal va a ser generada e
introducida al procesador residual. En el lado del descodificador,
es necesario calcular primero la primera señal de multicanal
reconstruida y luego, en base a la señal residual descodificada,
que es cualquier representación de la señal de error, la segunda
señal reconstruida tiene que ser generada. Así, independientemente
del hecho, si la primera señal reconstruida va a ser emitida o no,
tiene que ser calculada en el lado del descodificador.
En otra modalidad preferida de la presente
invención, el procedimiento de análisis mediante síntesis en el
lado del codificador y el cálculo de la primera señal de multicanal
reconstruido, independientemente del hecho, si va a ser emitida o
no, son reemplazados por un cálculo del lado del codificador directa
de la señal residual. Este está basado en un canal original
ponderado que depende de un parámetro de multicanal o está basado en
una clase de una mezcla descendente modificada que depende otra vez
de un parámetro de alineación. En este esquema, la información
adicional, esto es, la señal residual es calculada no iterativamente
utilizando los parámetros y las señales originales, pero no usado
el uno o más canales de mezcla descendentes.
Este esquema es muy eficiente en los lados del
codificador y el descodificador. Cuando la señal residual no es
transmitida o ha sido cortada de una corriente de datos escalables
debido a los requerimientos de ancho de banda, el descodificador de
la invención genera automáticamente una primera señal de multicanal
reconstruida a base del canal de mezcla descendente y los
parámetros de ganancia y alineación, en tanto que, cuando una señal
residual no es igual a cero es introducida, el reconstructor de
multicanal no calcula la primera señal de multicanal reconstruida,
sino que solamente calcula la segunda señal de multicanal
reconstruida. Así, este esquema de codificador/descodificador es
ventajoso en que permite un cálculo bastante eficiente en el lado
del codificador también como el lado del descodificador y utiliza la
representación de parámetros para reducir la redundancia en la
señal residual, de tal manera que se obtiene un esquema de
codificación/descodificación muy eficiente en energía de
procesamiento y eficiente en velocidad de bits.
Modalidades preferidas de la presente invención
son descritas en detalle con respecto a las figuras adjuntas, en
las cuales:
La figura 1 es un diagrama de bloques de una
representación general del codificador de multicanal de la
invención;
La figura 2 es un diagrama de bloques de una
representación general de un descodificador de multicanal;
La figura 3 es un diagrama de bloques de una
modalidad del lado del codificador de baja energía de
procesamiento;
La figura 4 es un diagrama de bloques de una
modalidad de descodificador para el sistema de codificador de la
figura 3;
La figura 5 es un diagrama de bloques de una
modalidad de codificador a base de análisis mediante síntesis;
La figura 6 es un diagrama de bloques de una
modalidad de descodificador correspondiente a la modalidad del
codificador de la figura 5;
La figura 7 es un diagrama de bloques general de
una modalidad de codificador directo que tiene redundancia reducida
en la señal residual codificada;
La figura 8 es una modalidad preferida de un
descodificador correspondiente al codificador de la figura 7;
La figura 9a es una modalidad preferida de un
esquema de codificador/descodificador a base del concepto de las
figuras 7 y 8;
La figura 9b es una modalidad preferida de la
modalidad de la figura 9a, cuando ninguna señal residual sino
solamente parámetros de alineación y ganancia son transmitidos;
La figura 9c es un conjunto de ecuaciones usadas
en el lado del codificador en las figuras 9a y 9b;
La figura 9d es un conjunto de ecuaciones usadas
en el lado del descodificador en las figuras 9a y 9b;
La figura 10 es una modalidad a base de banco de
filtro de análisis/banco de filtro de síntesis del esquema de las
figuras 9a a 9d; y
La figura 11 ilustra una comparación de un
desempeño típico de codificadores paramétricos y a base de forma de
onda convencionales y el codificador mejorado de la invención.
La figura 1 muestra una modalidad preferida de
un codificador de multicanal para codificar una señal de multicanal
original que tiene por lo menos dos canales. El primer canal puede
ser un canal izquierdo 10a y el segundo canal puede ser un canal
derecho 10b en un ambiente estéreo. Aunque las modalidades de la
invención son descritas en el contexto de un esquema estéreo, la
extensión a un esquema de multicanal es directa, puesto que una
representación de multicanal que tiene por ejemplo 5 canales tiene
varios pares de un primer canal y un segundo canal. En el contexto
de un esquema surround 5.1, el primer canal puede ser el canal
izquierdo frontal y el segundo canal puede ser el canal derecho
frontal. Alternativamente, el primer canal puede ser el canal
izquierdo frontal y el segundo canal puede ser el canal central.
Alternativamente, el primer canal puede ser el canal central y el
segundo canal puede ser el canal derecho frontal. Alternativamente,
el primer canal puede ser el canal izquierdo posterior (canal
surround izquierdo) y el segundo canal puede ser el canal derecho
posterior (canal surround derecho).
Un codificador de la invención puede incluir un
mezclador descendente 12 para generar uno o más canales de mezcla
descendente. En el ambiente estéreo, el mezclador descendente 12
generará un solo canal de mezcla descendente. En un ambiente de
multicanal, sin embargo, el mezclador descendente 12 puede generar
varios canales de mezcla descendente. En un ambiente de multicanal
5.1, el mezclador descendente 13 genera preferiblemente dos canales
de mezcla descendente. En general, el número de canales de mezcla
descendente es más pequeño que el número de canales en la señal de
multicanal original.
El codificador de multicanal de la invención
también incluye un proveedor de parámetro 14 para proporcionar uno
o más parámetros, el uno o más parámetros son formados de tal manera
que una señal de multicanal reconstruida puede ser formada
utilizando el uno o más canales de mezcla descendente derivados de
la señal de multicanal y el uno o más parámetros.
Importantemente, el codificador de multicanal de
la invención incluye además un codificador residual 16 para generar
una señal residual codificada. La señal residual codificada es
generada en base la señal de multicanal original, el uno o más
canales de mezcla descendente o el uno o más parámetros. En general,
la señal residual codificada es generada de tal manera que la señal
de multicanal reconstruida cuando es formada utilizando la señal
residual es más similar a la señal de multicanal original que cuando
es formada sin la señal residual. Así, la señal residual codificada
permite que el descodificador genere una señal de multicanal
reconstruida que tiene una calidad más alta que el umbral de
calidad paramétrico 1100 mostrado en la figura 11. El uno o más
parámetros y la señal residual codificada son introducidos a un
formador de corriente de datos 18, que forma una corriente de datos
que tiene la señal residual y el uno o más parámetros.
Preferiblemente, la corriente de datos emitida por el formador de
corriente de datos 18 es una corriente de datos escalada que tiene
una primera capa de mejora que incluye información en cuanto al uno
o más parámetros y una segunda capa de mejora que información en
cuanto a la señal residual codificada. Como es conocido en el arte,
las diferentes capas de escalamiento en una corriente de datos
escalada pueden ser descodificadas individualmente, de tal manera
que un dispositivo de bajo nivel, tal como un descodificador
paramétrico puro está en la posición para descodificar la corriente
de datos escalada al simplemente ignorar la segunda capa de
mejora.
En una modalidad de la presente invención, la
corriente de datos escalada incluye además, como una capa base, el
uno o más canales de mezcla descendente. Sin embargo, la presente
invención también es aplicable en un ambiente en el cual el usuario
ya está en posesión del canal de mezcla descendente. Esta situación
puede ocurrir, cuando el canal de mezcla descendente es una señal
mono o señal estéreo, que el usuario ya ha recibido vía otro canal
de transmisión o vía el mismo canal de transmisión pero antes en
comparación con la recepción de la primera capa de mejora y la
segunda capa de mejora. Cuando hay una transmisión separada
del(los) canal(es) de mezcla descendente y las
primeras y segundas capas de mejora, el codificador no tiene
necesariamente que incluir el mezclador descendente 12. Esta
situación es indicada por la línea discontinua del bloque del
mezclador descendente.
Adicionalmente, el proveedor de parámetros 14 no
tiene necesariamente que calcular realmente los parámetros en base
al primero y el segundo canal original. En situaciones en los cuales
los parámetros para una cierta señal de canal ya existen, es
suficiente proporcionar los parámetros ya generados al codificador
de la figura 1, de tal manera que estos parámetros son
suministrados al formador de corriente de datos 18 y al codificador
residual para ser usados opcionalmente para el cálculo de la señal
residual y para ser introducidos a la corriente de datos escalada.
Preferiblemente, sin embargo, el codificador residual usa
adicionalmente los parámetros como se muestra por una línea de
conexión de puntos 19.
En una modalidad preferida de la presente
invención, el codificador residual 16 puede ser controlado vía una
entrada de control de velocidad de bits separada. En este caso, el
codificador residual comprende un cierto codificador de pérdida tal
como un cuantificador que tiene un tamaño de etapa de cuantificador
controlable. Cuando un tamaño de etapa de cuantificador grande es
señalizada vía la entrada de control de velocidad de bits, la señal
residual codificada tendrá un intervalo de valor más pequeño (el
índice de cuantificación más grande emitido por el cuantificador)
en comparación con un caso en el cual un tamaño de etapa de
cuantificador más pequeño es señalizado vía la entrada de control
de velocidad de bits. El tamaño de etapa de cuantificador grande
dará como resultado una demanda de bits más baja para la señal
residual codificada y por consiguiente, dará como resultado una
corriente de datos escalada que tiene una velocidad de bits reducida
en comparación con el caso en el cual el cuantificador dentro del
codificador residual 16 tiene un tamaño de etapa de cuantificador
más pequeño dando como resultado una señal residual codificada que
necesita más bits.
Estrictamente hablando, las observaciones
anteriores se aplican a la cuantificación escalar. Dicho en general,
sin embargo, es preferido usar un codificador que tiene resolución
controlable, que está a base de una técnica de cuantificación de
vector. Cuando la resolución es alta, se requieren más bits para
codificar la señal residual en comparación con el caso en el cual
la resolución es baja.
La figura 2 muestra una modalidad preferida de
un descodificador de multicanal de la invención, que puede ser
usado en relación con el codificador de la figura 1. En particular,
la figura 2 muestra un descodificador de multicanal para
descodificar una señal de multicanal codificada que tiene uno o más
canales de mezcla descendente, uno o más parámetros y una señal
residual codificada. Toda esta información, esto es, el canal de
mezcla descendente, los parámetros y las señalarse residuales
codificadas son incluidos en una corriente de datos escalada 20
introducida a un analizador sintáctico de corriente de datos que
extrae la señal residual codificada de la corriente de datos
escalada 20 y envía la señal residual codificada a un descodificador
residual 22. Análogamente, el uno o más canales de mezcla
descendente preferiblemente codificados son proporcionados a un
descodificador de mezcla descendente 24. Adicionalmente, los uno o
más parámetros preferiblemente codificados son proporcionados a uno
descodificador de parámetros 23 para proporcionar el uno o más
parámetros en una forma descodificada. Esta información emitida por
los bloques 22, 23 y 24 es introducida a un descodificador de
multicanal 25 para generar una primera señal de multicanal
reconstruida 26 o una segunda señal de multicanal reconstruida 27.
La primera señal de multicanal reconstruida es generada por el
descodificador de multicanal 25 utilizando el uno o más canales de
mezcla descendente y el uno o más parámetros, pero no usando la
señal residual. La segunda señal de multicanal reconstruida 27, sin
embargo, es generada utilizando el uno o más canales de mezcla
descendente y la señal residual descodificada. Puesto que la señal
residual incluye información adicional y preferiblemente
información de forma de onda, la segunda señal de multicanal
reconstruida 27 es más similar a una señal de multicanal original
(tales como canales 10a y 10b de la figura 1) que la primera señal
de multicanal reconstruida.
Dependiendo de la cierta implementación del
descodificador de multicanal 25, el descodificador de multicanal 25
emitirá ya sea la primera señal de multicanal reconstruido 26 o la
segunda señal de multicanal reconstruida 27. Alternativamente, el
descodificador de multicanal 25 calcula la primera señal de
multicanal reconstruida además de la segunda señal de multicanal
reconstruida. Naturalmente, en todas las implementaciones, el
descodificador de multicanal 25 solamente emitirá la segunda señal
de multicanal reconstruida, cuando la corriente de datos escalada
incluye la señal residual codificada. Sin embargo, cuando la
corriente de datos escalada es procesada desde el codificador al
descodificador al separar la segunda capa de mejora, el
descodificador de multicanal 25 solamente emitirá la primera señal
de canal reconstruida. Tal separación de la segunda capa de mejora
puede tomar lugar cuando hubo un canal de transmisión en camino
entre el codificador y el descodificador, que tuvo recursos de
ancho de banda altamente limitados, de tal manera que la transmisión
de la corriente de datos escalada fue solamente posible sin la
segunda capa de mejora.
Las figuras 3 y 4 ilustran una modalidad de
concepto de la invención, que requiere solamente energía de
procesamiento reducida en el lado de codificador (figura 3) también
como en el lado del descodificador (figura 4). El codificador de la
figura 3 incluye un codificador estéreo de intensidad 30, que emite
una mono señal de mezcla descendente por una parte e información de
dirección estéreo de intensidad paramétrica por otra parte. La mono
mezcla descendente, que es preferiblemente formada al agregar el
primero y el segundo canal de entrada y la información de dirección
paramétrica son introducidos a un reductor de velocidad de datos 31.
Para el canal de mono mezcla descendente, el reductor de velocidad
de datos 31 puede incluir cualquiera de los codificadores de audio
bien conocidos, tales como un codificador MP3, un codificador AAC o
cualquier otro codificador de audio para mono señales. Para la
información de dirección paramétrica, el reductor de velocidad de
datos 31 puede incluir cualquiera de los codificadores conocidos
para información paramétrica tales como un decodificador de
diferencia, un cuantificador y/o un codificador de entropía tal
como un codificador de Huffman o un codificador aritmético. Así,
los bloques 30 y 31 de la figura 3 proporcionan las funcionalidades
ilustradas esquemáticamente por los bloques 12 y 14 del codificador
de la figura 1.
El codificador residual 16 incluye un calculador
de señal lateral 32 y un reductor de velocidad de datos aplicado
subsecuentemente 33. El calculador de señal lateral 32 efectúa un
cálculo de señal lateral conocido de codificadores medio/lateral
del arte previo. Un ejemplo preferido es un cálculo de diferencia de
muestra en muestra entre el primer canal 10a y el segundo canal 10b
para obtener una señal lateral tipo forma de onda, que luego es
introducida al reductor de velocidad de datos 33 para la compresión
de velocidad de datos. El reductor de velocidad de datos 33 puede
incluir los mismos elementos como se bosqueja adicionalmente con
respecto al reductor de velocidad de datos 31. En la salida del
bloque 33, se obtiene una señal residual codificada, que es
introducida al formador de corriente de datos 18, de tal manera que
se obtiene una corriente de datos preferiblemente escalada.
La corriente de datos emitida por el bloque 18
incluye ahora, además de la mono mezcla descendente, información de
dirección estéreo de intensidad paramétrica también como una señal
residual codificada tipo forma de onda.
El reductor de velocidad de datos 33 puede ser
controlado por una entrada de control de velocidad de bits como ya
se discute en relación con la figura 1. En otra modalidad, el
reductor de velocidad de datos 33 está dispuesto para generar una
corriente de datos de salida escalada que tiene, en su capa base,
una señal residual codificada con un número de bits bajo por
muestra y que tiene, en su primera capa de mejora, una señal
residual codificada con un número medio de bits por muestra y que
tiene, en su siguiente capa de mejora, una señal residual
codificada con otra vez un número más alto de bits por muestra. Para
la capa base de la salida del reductor de velocidad de datos, se
puede usar por ejemplo 0.5 bits por muestra. Para la primera capa de
mejora se pueden usar por ejemplo 4 bits por muestra y para la
segunda capa de mejora se pueden usar por ejemplo 16
bits/muestra.
Un descodificador correspondiente es mostrado en
la figura 4. La corriente de datos introducida al analizador
sintáctico de corriente de datos 21 es analizada sintácticamente
para emitir separadamente información de parámetros al descompresor
23. La información de mezcla descendente codificada es introducida
al descompresor 24 y la señal residual codificada es introducida al
descompresor residual 22. El descodificador de la figura 4 incluye
además un descodificador estéreo de intensidad directo 40 y además
un descodificador medio/lateral 41. Ambos descodificadores 40 y 41
efectúan las funciones del descodificador de multicanal 25 para
emitir la primera señal de multicanal reconstruida 26, que es
solamente generada por el descodificador estéreo de intensidad 40 y
para emitir la segunda señal de multicanal reconstruida 27, que es
solamente generada por el descodificador de MS 41.
Cuando la corriente de datos incluye una señal
residual codificada, la implementación directa en la figura 4
emitiría la primera señal de multicanal reconstruida 26, también
como en la segunda señal de multicanal reconstruida. Naturalmente,
solo la mejor segunda señal de multicanal reconstruida 27 es
interesante para el usuario en esta situación. Por consiguiente, un
control de descodificador 42 puede ser proporcionado para detectar,
si hay una señal residual codificada en la corriente de datos.
Cuando es detectada, de tal manera que ninguna de tal señal
residual codificada está en la corriente de datos, el control de
descodificador 42 es operativo para desactivar el descodificador
medio/lateral 40 para ahorrar energía de procesamiento y por
consiguiente, energía de la batería que es especialmente útil en un
dispositivo portátil de baja energía tal como un teléfono móvil,
etc.
La figura 5 muestra otra modalidad de la
presente invención, en la cual la señal residual codificada es
generada en base a un procedimiento de análisis mediante síntesis.
Otra vez, los primeros y segundos canales 10a, 10b son introducidos
a un mezclador descendente 50, que es seguido por un reductor de
velocidad de datos 51. En la salida del bloque 51, una señal de
mezcla descendente preferiblemente comprimida que tiene uno o más
canales de mezcla descendente es obtenida y suministrada al
formador de corriente de datos 18. Así, los bloques 50 y 51
proporcionan la funcionalidad del dispositivo mezclador descendente
12 de la figura 1. Adicionalmente, los primeros y los segundos
canales de entrada 10a, 10b son suministrados a un calculador de
parámetros 53 y los parámetros emitidos por el calculador de
parámetros son enviados a otro reductor de velocidad de datos 54
para comprimir el uno o más parámetros. Así, los bloques 53 y 54
proporcionan la misma funcionalidad como el proveedor de parámetros
14 de la
figura 1.
figura 1.
En contraste con la modalidad de la figura 3,
sin embargo, el codificador residual 16 es más sofisticado. En
particular, el codificador residual 16 incluye un reconstructor de
multicanal paramétrico 55. El reconstructor de multicanal genera,
para el ejemplo de dos canales, un primer canal reconstruido y un
segundo canal reconstruido. Puesto que el reconstructor de
multicanal paramétrico usa solamente los canales de mezcla
descendente y los parámetros, la calidad de la señal de multicanal
reconstruida emitida por el bloque 55 corresponderá a la curva 1102
en la figura 11 y siempre estará debajo del umbral paramétrico 1100
de la figura 11.
La señal de multicanal reconstruida es
introducida a un calculador de error 56. El calculador de error 56
es operativo para también recibir el primero y el segundo canal de
entrada 10a y 10b y emite una primera señal de error y una segunda
señal de error. Preferiblemente, el calculador de error calcula una
diferencia de muestra en muestra entre un canal original y un canal
reconstruido correspondiente (bloque de salida 55). Este
procedimiento es efectuado para cada par de canal original y canal
reconstruido. La salida del calculador de error 56 es -otra vez-
una representación de multicanal, pero ahora, en contraste con la
señal de multicanal original, una señal de error de multicanal.
Esta señal de error de multicanal que tiene el mismo número de
canales como la señal de multicanal original es introducida a un
procesador residual 57 para generar la señal residual
codificada.
Existen numerosas implementaciones del
procesador residual 57, que dependen todas de los requerimientos de
ancho de banda, grado requerido de escalabilidad, requerimientos de
calidad, etc.
En una implementación preferida, el procesador
residual 57 es otra vez implementado como un codificador de
multicanal que genera uno o más canales de mezcla descendente de
error y parámetros de mezcla descendente de error. Se puede decir
que esta modalidad es una clase de un codificador de multicanal
iterativo, puesto que el procesador residual 57 podría incluir los
bloques 50, 51, 53 y 54.
Alternativamente, el procesador residual 57
puede ser operativo para seleccionar solamente uno o dos canales de
error a partir de su señal de entrada, que tiene la energía más alta
y para procesar solamente la señal de error de energía más alta
para obtener la señal residual codificada. Además o en lugar de este
criterio, criterios más avanzados pueden ser usados que son a base
de medidas de error motivadas más perceptualmente.
Alternativamente, el procesador residual podría incluir un esquema
de formación de matriz para la mezcla descendente de los canales de
entrada a uno o más canales de entrada descendente, de tal manera
que un dispositivo de descodificadores correspondientes efectuaría
un procedimiento de des-formación de matriz análogo.
El uno o más canales de mezcla descendente pueden luego ser
procesados utilizando elementos de un codificador mono o estéreo
bien conocido o pueden ser procesados completamente utilizando uno
de los codificadores mono-estéreo mencionados
anteriormente para obtener la señal residual codificada.
Un descodificador para el codificador de la
figura 5 es mostrado en la figura 6. En comparación con la modalidad
de la figura 2, la figura 6 revela que el descodificador de
multicanal 25 incluye un reconstructor de multicanal paramétrico 60
y un combinador 61. El reconstructor de multicanal paramétrico 60
genera la primera señal de multicanal reconstruida 26 solamente en
base a información de mezcla descendente descodificada e información
de parámetros descodificada. La primera señal reconstruida 26 puede
ser emitida, cuando ninguna señal residual codificada está incluida
en la corriente de datos. Sin embargo, cuando una señal residual
codificada está incluida en la corriente de datos, la primera señal
reconstruida no es emitida sino introducida a un combinador 61 para
combinar la señal de multicanal reconstruida paramétricamente 26 a
la señal residual descodificada que es una de las representaciones
de la representación de error en la salida de calculador de error 56
de la figura 5 como se discute anteriormente. El combinador 61
combina la señal residual descodificada, esto es, cualquier
representación de la señal de error y la señal de multicanal
reconstruida paramétricamente para emitir la segunda señal
reconstruida 27. Cuando el descodificador de la figura 6 es
considerado con respecto a la figura 11, se vuelve claro que, para
una cierta velocidad de bits, la primera señal reconstruida tiene
una calidad determinada por la línea 1102, en tanto que la segunda
señal reconstruida 27 tiene una calidad más alta determinada por la
línea 1114 para la misma velocidad de bits.
La modalidad de la figura 5/figura 6 es
preferible a la modalidad de la figura 3/figura 4, puesto que la
redundancia en la señal residual codificada es reducida. Sin
embargo, la modalidad de la figura 5/figura 6 requiere una cantidad
más alta de energía de procesamiento, almacenamiento, recursos de
batería y retardo algorítmico.
Una solución intermedia preferida entre la
modalidad de las figuras 3/figura 4 y la modalidad de la figura
5/figura 6 es descrita subsecuentemente con referencia a la figura 7
en cuanto a una representación de codificador y figura 8 en cuanto
a una representación de descodificador. El codificador incluye un
cierto mezclador descendente 70 para efectuar una mezcla
descendente utilizando los primeros y segundos canales de entrada
10a, 10b. En contraste con una simple muestra descendente, que es
generada por solamente agregar ambos canales originales 10a, 10b
para obtener una mono señal, el mezclador descendente 70 es
controlado por un parámetro de alineación generado por un
calculador de parámetros 71. Aquí, ambos canales de entrada 10a, 10b
son alineados en el tiempo entre sí antes de que ambas señales sean
agregadas entre sí. De esta manera, una mono señal especial es
obtenida en la salida del mezclador descendente 70, tal mono señal
es diferente de una mono señal por ejemplo generada por un
codificador estéreo de intensidad de bajo nivel como se muestra con
el número 30 en la figura 3.
Además del parámetro de alineación o en lugar
del parámetro de alineación, el calculador de parámetro 71 es
operativo para generar un parámetro de ganancia. El parámetro de
ganancia es introducido a un dispositivo ponderador 72 para
ponderar preferiblemente el segundo canal 10b utilizando el
parámetro de ganancia, antes de que se efectúe un cálculo de la
señal lateral. La ponderación del segundo canal antes de calcular la
diferencia semejante a forma de onda entre el primero y el segundo
canal da como resultado una señal residual más pequeña, que es
mostrada en la entrada de la señal lateral especial a cualquier
reductor de velocidad de datos apropiado 33. El reductor de
velocidad de datos 33 mostrado en la figura 7 puede ser implementado
exactamente como el reductor de velocidad de datos 33 mostrado en
la figura 3.
La modalidad de la figura 7 es diferente de la
modalidad de la figura 3 en que se toma en cuenta información de
parámetros para preferiblemente en el mezclador descendente 70
también como el cálculo de señal residual, de al manera que la
señal residual emitida por el reductor de velocidad de datos 33 de
la figura 7 puede ser representada por un número más bajo de bits
que la señal emitida por el reductor de velocidad de datos 33. Esto
es debido al hecho de que la señal residual de la figura 7 incluye
menos redundancia que la señal residual de la figura 3.
La figura 8 muestra una modalidad preferida de
una implementación de descodificador correspondiente a la
implementación de codificador de la figura 7. Contrario al
descodificador de la figura 6, el reconstructor de multicanal 25 es
operativo para emitir automáticamente la primera señal de multicanal
reconstruida 26, cuando la señal lateral, esto es, la señal
residual es cero o para emitir automáticamente la segunda señal de
multicanal reconstruido 27, cuando la señal residual no es igual a
cero. Así, el reconstructor de multicanal 25 de la figura 8 no
puede emitir ambas señales 26 y 27 simultáneamente, sino que puede
solamente emitir una primera de las dos señales o una segunda de
las dos señales. Así, la modalidad de la figura 8 no requiere ningún
control de descodificador tal como se muestra en la
figura 4.
figura 4.
En particular, el descodificador de señal
residual 22 en la figura 8 emite la señal lateral especial tal como
es generada por el elemento 72 de codificador correspondiente de la
figura 7. Adicionalmente, el descodificador de mezcla descendente
24 emite la mono señal especial tal como es generada por el
mezclador descendente 70 de la figura 7.
Luego, la señal lateral especial y la mono señal
especial son introducidas al descodificador de multicanal
conjuntamente con el parámetro de ganancia y el parámetro de
alineación de tiempo. El parámetro de ganancia es operativo para
controlar la etapa de ganancia 80 al aplicar una ganancia de acuerdo
con una primera regla de ganancia. Adicionalmente, el parámetro de
ganancia controla las etapas de ganancia adicionales 82, 83 para
aplicar una ganancia de acuerdo con una segunda regla de ganancia
diferente. Adicionalmente, el reconstructor de multicanal incluye
un sustractor 84 y un adicionador 85 también como un bloque de
desalineación de tiempo 86 para generar un primer canal
reconstruido y un segundo canal reconstruido.
Subsecuentemente, se hace referencia a una
modalidad preferida del esquema de codificador/descodificador de
las figuras 7 y 8. La figura 9a muestra un esquema de
codificador/descodificador completo de acuerdo con un aspecto de la
presente invención. En la cual la señal residual d(n) no es
igual a cero. Adicionalmente, la figura 9b indica el
codificador/descodificador escalable de la figura 9a, cuando ninguna
señal de diferencia d(n) ha sido calculada o cuando la
corriente de datos ha sido separada para reducir la señal residual,
por ejemplo debido a un requerimiento relacionado con ancho de
banda de transmisión. En el caso de separación de la señal residual
codificada de la corriente de datos transmitida de un codificador a
un descodificador en la modalidad de la figura 9a, la modalidad de
la figura 9a se convierte en un escenario de multicanal paramétrico
puro, en el cual el parámetro de alineación y el parámetro de
ganancia son los parámetros de multicanal y la mono señal espacial
es el canal de mezcla descendente transmitido desde el lado del
codificador al lado del descodificador.
La reconstrucción de multicanal en el lado de
descodificador es efectuada utilizando solamente los parámetros de
alineación y ganancia, puesto que no se recibe ninguna señal
residual en el lado del descodificador, esto es, d(n) es
igual a cero.
La figura 9c muestra las ecuaciones
fundamentales del codificador de la invención, en tanto que la
figura 9d indica la ecuación fundamental para el descodificador de
la invención.
En particular, el codificador de la invención,
incluye, como proveedor de parámetros 14 de la figura 1, el
calculador de parámetros 71. El calculador de parámetros 71 es
operativo para calcular un parámetro de alineación de tiempo para
alinear el canal derecho r(n) al canal izquierdo l(n).
En las figuras 9a a 9d, el canal derecho alineado es indicado
por
r_{a}(n). El parámetro de alineación es extraído preferiblemente mediante superposición de bloques de la señal de entrada. El parámetro de alineación corresponde al retardo de tiempo entre el canal izquierdo y el canal derecho y es estimado preferiblemente utilizando técnicas de correlación cruzada de dominio de tiempo. Para el caso cuando no hay ganancia de alineación en una sub-banda, por ejemplo en el caso de señales independientes, el parámetro de retardo es ajustado a cero. Preferiblemente, un parámetro de retardo (alineación de tiempo) es estimado por sub-banda en la estructura de sub-banda. En una modalidad preferida, una velocidad de análisis fija de 46 ms y 50% de superposición de ventanas de Hamming se ha empleado.
r_{a}(n). El parámetro de alineación es extraído preferiblemente mediante superposición de bloques de la señal de entrada. El parámetro de alineación corresponde al retardo de tiempo entre el canal izquierdo y el canal derecho y es estimado preferiblemente utilizando técnicas de correlación cruzada de dominio de tiempo. Para el caso cuando no hay ganancia de alineación en una sub-banda, por ejemplo en el caso de señales independientes, el parámetro de retardo es ajustado a cero. Preferiblemente, un parámetro de retardo (alineación de tiempo) es estimado por sub-banda en la estructura de sub-banda. En una modalidad preferida, una velocidad de análisis fija de 46 ms y 50% de superposición de ventanas de Hamming se ha empleado.
El calculador de parámetros 71 calcula además el
valor de ganancia. El valor de ganancia es también extraído
preferiblemente de la superposición de bloques de la señal.
Normalmente, el parámetro de ganancia es idéntico al parámetro de
diferencia de nivel usado comúnmente en codificación paramétrica tal
como el esquema de codificación de indicación binaural bien
conocido. Alternativamente, el valor de ganancia puede ser calculado
utilizando un procedimiento iterativo, en el cual la señal de
diferencia es retroalimentada al calculador de parámetros y el
valor de ganancia es ajustado de tal manera que la señal de
diferencia llega a un valor mínimo como se muestra por la línea
discontinua 90 en la figura 9a. Tan pronto como la alineación y
ganancia de parámetros son calculados, el mezclador descendente 70
en la figura 7, también como el codificador residual 16 en la
figura 7 pueden ser reiniciados. En particular, el mezclador
descendente 70 de la figura 7 incluye un bloque de alineación 91
para retardar un canal por el parámetro de alineación de tiempo
calculado. Luego el segundo canal retardado r_{a}(n)
agregado al primer canal utilizando un dispositivo adicionador 92.
En la salida del adicionador 92, el canal de mezcla descendente
está presente. Así, el mezclador descendente 70 en la figura 7
incluye los bloques 91 y 92 para formar la mono señal especial.
El codificador residual 16 en la figura 7
incluye además el ponderador 93 y el calculador de señal lateral
subsecuente 94, que calcula la diferencia entre el primer canal
original y el segundo canal alineado y ponderado. En particular,
para la ponderación del segundo canal alineado, la primera regla de
ponderación usada en un bloque de lado del descodificador
correspondiente 80 es efectuada. Así, el codificador residual 16
incluye el dispositivo de alineación 91, el dispositivo de
ponderación 93 y el calculador de señal lateral 94. Puesto que el
segundo canal alineado es usado para la mezcla descendente también
como el cálculo residual, es suficiente calcular el canal derecho
alineado solamente un vez y enviar el resultado al mezclador
descendente 70 también como al ponderador/calculador de señal
lateral 72 en la figura 7.
Preferiblemente, los factores de alineación y
ganancia son escogidos de tal manera que el proceso es reversible,
de tal manera que las ecuaciones de la figura 9d son bien definidas
y bien acondicionadas numéricamente.
Un mono codificador genérico puede ser usado
para el mono codificador 51 para codificar la señal de suma y un
codificador residual preferiblemente especializado 33 es empleado
para el residual.
Cuando el mono codificador 51 es sin pérdidas,
esto es, cuando la mono señal no es cuantificada adicionalmente y
ya sea el codificador residual es también sin pérdidas o el
modalidad de señal de alineación coincide con la señal fuente
perfectamente, entonces la estructura de codificación de la
invención mostrada en la figura 9a tiene la propiedad de
reconstrucción perfecta que también asume que los parámetros de
alineación y ganancia están solamente sujetos a un esquema de
codificación sin pérdidas.
\newpage
El sistema de la invención de la figura 9a
proporciona una estructura para un esquema que puede operar con
degradación agraciada sobre una multitud de intervalos como se
indica en la figura 11, línea 1114. En particular, sin codificación
residual, esto es, d(n) = 0, el esquema se reduce a la
codificación estéreo paramétrico al transmitir solamente los
parámetros de alineación y ganancia (como parámetros de multicanal)
además de la mono señal (como en canal de mezcla descendente). Esta
situación es ilustrada en la figura 9b. Adicionalmente, el sistema
de la invención tiene la ventaja de que el método de alineación
trata automáticamente el problema de mono mezcla descendente.
Subsecuentemente, se hace referencia a la figura
10 que ilustra una implementación de la modalidad de la invención
ilustrada en las figuras 9a a 9d a una estructura de codificación de
sub-banda. Los canales izquierdo y derecho
originales son introducidos a un banco de filtro de análisis 1000
para obtener varias señales de sub-banda. Para cada
señal de sub-banda, un esquema de
codificación/descodificación como se muestra en las figuras 9a a 9d
es utilizado. En el lado del descodificador, las señales de
sub-banda reconstruidas son combinadas en un banco
de filtro de síntesis 1010 para llegar finalmente a las señales de
multicanal reconstruidas de plena banda. Naturalmente, para cada
sub-banda, un parámetro de alineación y un parámetro
de ganancia va a ser transmitido desde el lado de codificador al
lado del descodificador como se ilustra por una flecha 1020 en la
figura 10.
La implementación preferida de la estructura de
codificación de sub-banda de la figura 10 está
basada en un banco de filtros modulados de coseno con dos etapas,
con el fin de obtener anchos de banda de sub-banda
desiguales (en una escala motivada perceptualmente). La primera
etapa divide la señal en M bandas. Las M señales de
sub-banda son decimadas críticamente y alimentadas
al segundo banco de filtro de etapas. El k-ésimo filtro de la
segunda etapa,
k \epsilon {1, ..., M}, tiene M_{k} bandas. En una implementación preferida, se usan M = 8 bandas y una estructura de sub-banda como en la tabla de la figura 10, dando como resultado 36 sub-bandas efectivas después de las dos etapas es preferido. Los filtros de prototipo son designados de acuerdo con [13] con por lo menos 100 dB que amortiguan en la banda de retención. El orden de filtros en la primera etapa es 116 y el orden de filtro máximo en la segunda etapa es 256. La estructura de codificación es luego aplicada a pares de sub-bandas (correspondientes a los canales de sub-banda izquierdo y derecho).
k \epsilon {1, ..., M}, tiene M_{k} bandas. En una implementación preferida, se usan M = 8 bandas y una estructura de sub-banda como en la tabla de la figura 10, dando como resultado 36 sub-bandas efectivas después de las dos etapas es preferido. Los filtros de prototipo son designados de acuerdo con [13] con por lo menos 100 dB que amortiguan en la banda de retención. El orden de filtros en la primera etapa es 116 y el orden de filtro máximo en la segunda etapa es 256. La estructura de codificación es luego aplicada a pares de sub-bandas (correspondientes a los canales de sub-banda izquierdo y derecho).
El agrupamiento correspondiente de las
sub-bandas entre el primero y el segundo banco de
filtros de etapas es mostrado en la tabla a la derecha en la figura
10, que hace claro que la primera sub-banda k
incluye 16 sub-bandas. Adicionalmente, la segunda
sub-banda incluye 8 sub-bandas,
etc.
Se obtiene codificación paramétrica eficiente
utilizando técnicas de cuantificación de vector de mezcla Gaussiana
(VQ) (GM). La cuantificación basada en modelos GM es popular en el
campo de codificación de habla [14-16] y facilita
la implementación de baja complejidad de VQ dimensional alto. En una
implementación preferida, se cuantifican por vectores de
36-dimensionales de ganancia y parámetros de
retardo. Los modelos GM todos tienen 16 componentes de mezcla y son
entrenados en una base de datos de parámetros extraídos de 60
minutos de datos de audio (con contenido variable y disjuntos de
señales de prueba de evaluación subsecuente). Métodos a base de
modelos estadísticos explícitos son usados menos frecuentemente en
codificación de audio que en codificación de habla. Una razón de
esta creencia equivocada en la habilidad de modelos estadísticos
para capturar toda la información relevante contenida en audio
general. En un caso preferido, evaluación preliminar utilizando
procedimientos de prueba abiertos y cerrados de modelos de parámetro
indican sin embargo que este no es un problema en este caso. La
velocidad de bits resultante para los parámetros de ganancia y
retardo es 2.3 kbps.
La estructura de sub-banda es
aprovechada para la codificación de las señales residuales. Con el
mismo procesamiento por bloques como se describe adicionalmente, la
varianza en cada sub-banda es estimada y las
varianzas son cuantificadas por vectores utilizando GM VQ a través
de sub-bandas (esto es, un vector
36-dimensional es codificado a la vez). Las
varianzas facilitan la asignación de bits entre las
sub-bandas que usan un algoritmo de asignación de
bits codicioso [17, página 234]. Luego las señales de
sub-banda son codificadas utilizando cuantificadores
escalares uniformes.
La ganancia instantánea g(n) y retardo
\tau(n) son obtenidos mediante interpolación lineal de los
estimados de bloques. El retardo variable en el tiempo es realizado
por medio de un filtro de retardo fraccional de
73-orden a base de una respuesta de impulso de
sincronización truncada y de ventana de Hamming [18]. Los
coeficientes de filtro son actualizados en una base según muestra
utilizando el parámetro de retardo interpolado.
Se propone una estructura para la codificación
flexible de la imagen estéreo en audio general. Con la nueva
estructura, es posibles moverse sin costuras desde un modo estéreo
paramétrico a codificación de aproximadamente de forma de onda. Una
implementación ejemplar de las ideas fue probada, tanto usando un
residual sin codificar para evaluar el efecto de incrementar la
velocidad de bits del codificador residual y utilizando un
codificador de núcleo MP3, con el fin de evaluar el esquema de un
escenario o más real.
Para estabilizar la imagen estéreo, es preferido
filtrar en paso de bajos los parámetros en un sistema paramétrico
puro o en un sistema escalable que tiene una parte paramétrica pura
que puede ser usada por un descodificador sin procesar la señal
residual, como se hace en por ejemplo [9]. Esto reduce la ganancia
de alineación del sistema. Al codificar el residual utilizando
codificación de sub-banda escalar, la calidad es
incrementada adicionalmente y se aproxima a la calidad
transparente. En particular, la adición de bits al residual
estabiliza la imagen estéreo y el ancho de estéreo es también
incrementado. Además, técnicas de segmentación de tiempo flexible y
velocidad variable (por ejemplo, depósito de bits) son preferidos
para aprovechar mejor la naturaleza dinámica de audio general. Un
parámetro de coherencia es incluido preferiblemente en el filtro de
alineación para mejorar el modo paramétrico. Codificación residual
mejorada, que emplea el escalamiento perceptual, cuantificación de
vector y codificación diferencial, conducen a irrelevancia más
eficiente y remoción de redundancia.
Aunque el sistema de la invención se ha descrito
en el contexto de codificación estéreo y en el contexto de un
esquema de codificación medio/lateral mejorado paramétricamente, se
notará en la presente que cada esquema de
codificación/descodificación paramétrico de multicanal tal como una
clase de intensidad estéreo generalizada de codificación se puede
aprovechar de un componente del lado adicionalmente encerrado para
llegar adicionalmente a la propiedad de reconstrucción perfecta.
Aunque una modalidad preferida de un esquema de
codificador/descodificador de la invención se ha descrito
utilizando una alineación de tiempo en el lado del codificador,
transmisión del parámetro de alineación y uso de desalineación de
tiempo en el lado del descodificador, existen alternativas
adicionales, que llevan a cabo la alineación de tiempo en el lado
del descodificador para generar una señal de diferencia pequeña,
pero que no efectúa la desalineación de tiempo en el lado del
descodificador, de tal manera que el parámetro de alineación no
será transmitido del codificador al descodificador. En esta
modalidad, la cancelación de la desalineación de tiempo incluye
naturalmente un artefacto. Sin embargo, este artefacto en la
mayoría de los casos no es serio de tal manera que tal modalidad es
especialmente apropiada para descodificadores de multicanal de bajo
precio.
Por consiguiente, la presente invención puede
también ser considerada como una extensión de una esquema de
codificación estéreo paramétrico preferiblemente tipo BCC o
cualquier otro esquema de codificación de multicanal, que cae
completamente de regreso a un esquema puramente paramétrico, cuando
la señal residual codificada es separada. De acuerdo con la
presente invención, un sistema puramente paramétrico es mejorado al
transmitir varios tipos de información adicional que incluye
preferiblemente la señal residual en un estilo de forma de onda, el
parámetro de ganancia y/o el parámetro de alineación de tiempo. Así,
una operación de descodificación que utiliza la información
adicional da como resultado una calidad más alta que la que sería
disponible con técnicas paramétricas solas.
Dependiendo de los requerimientos, los métodos
de codificación o descodificación de la invención pueden ser
implementados en elementos físicos, elementos de programación o en
elementos fijos. Por consiguiente, la invención también es
concerniente con un medio que se puede leer por computadora que
tienen almacenado un código de programa, que cuando se ejecuta en
una computadora da como resultado uno de los métodos de la
invención. Así, la presente invención es un programa de computadora
que tiene un código de programa, que cuando es ejecutado en una
computadora da como resultado el método de la invención.
\vskip1.000000\baselineskip
[1] J.D. Johnston y A.J. Ferreira,
"Sum-difference stereo transform coding", en
Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing
(ICASSP), 1992, vol. 2, págs. 569.572.
[2] R. Waal y R. Veldhuis,
"Subband coding of stereophonic digital audio signals", en
Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing
(ICASSP), 1991, págs. 3601.3604.
[3] J. Herre, K. Brandenburg, y D.
Lederer, "Intensity stereo coding", en Preprint 3799,
96th AES Convention, 1994.
[4] K. Brandenburg, "MP3 and AAC
explained", en Proc. of the AES 17th International Conference,
paper no. 17-009, 1999.
[5] J. Blauert, Spatial hearing: the
psychophysics of human sound localization, The MIT Press,
Cambridge, Massachusetts, 1997.
[6] H. Fuchs, "Improving joint stereo
audio coding by adaptive inter-channel
prediction", en Proc. of IEEE Workshop on Applications of
Signal Processing to Audio and Acoustics, 1993, págs.
39.42.
[7] H. Fuchs, "Improving MPEG audio
coding by backward adaptive linear stereo prediction", en
Preprint 4086, 99th AES Convention, 1995.
[8] F. Baumgarte y C. Faller,
"Binaural cue coding. part I: Psychoacoustic fundamentals and
design principles", IEEE Trans. Speech Audio Processing,
vol. 11, no. 6, págs. 509.519, 2003.
[9] C. Faller y F. Baumgarte,
"Binaural cue coding. part II: Schemes and applications",
IEEE Trans. Speech Audio Processing, vol. 11, no. 6, págs.
520.531, 2003.
[10] C. Faller, Parametric Coding of
Spatial Audio, Ph. D. thesis, Ecole Polytechnique Federale de
Lausanne, 2004.
[11] J. Breebaart, S. van de Par,
A. Kohlrausch, y E. Schuijers,
"High-quality parametric spatial audio coding at
low bitrates", en Preprint 6072, 116th AES Convention,
2004.
[12] J. Herre, C. Faller, C.
Ertel, J. Hilpert, A. Hoelzer, y C.
Spenger, "MP3 surround: Efficient and compatible coding of
multi-channel audio", en Preprint 6049, 116th AES
Convention, 2004.
[13] Y-P. Lin and P.P.
Vaidyanaythan, "A Kaiser window approach for the design of
prototype filters of cosine modulated filterbanks", IEEE
Signal Processing Letters, vol. 5, nº. 6, págs. 132.134,
1998.
[14] P. Hedelin y J. Skoglund,
"Vector quantization based on Gaussian mixture models", IEEE
Trans. Speech Audio Processing, vol. 8, nº. 4, págs. 385.401,
2000.
[15] A.D. Subramaniam y B.D. Rao,
"PDF optimized parametric vector quantization of speech line
spectral frequencies", IEEE Trans. Speech Audio
Processing, vol. 11, nº. 2, págs. 130.142, 2003.
[16] J. Lindblom y P. Hedelin,
"Variable-dimension quantization of sinusoidal
amplitudes using Gaussian mixture models", en Proc. IEEE Int.
Conf. Acoust., Speech, Signal Processing (ICASSP), 2004,
vol. 1, págs. 153.156.
[17] A. Gersho y R. M. Gray,
Vector Quantization and Signal Compression, Kluwer Academic
Publishers, Boston, 1992.
[18] T.I. Laakso, V. Välimäki, M.
Karjalainen, y U.K. Laine, "Tools for fractional
delay filter design", IEEE Signal Processing Magazine,
págs. 30.60, enero 1996.
[19] ITU-R Recommendation
BS.1534, Method for the Subjective Assessment of Intermediate
Quality Level of Coding Systems, ITU-T,
2001.
[20] "The LAME project",
http://lame.sourceforge.net/, July 2004, v3.96.1.
Claims (26)
1. Un codificador de multicanal para codificar
una señal de multicanal original que tiene por lo menos dos
canales, caracterizado porque comprende:
un proveedor de parámetros para proporcionar uno
o más parámetros, el uno o más parámetros son formados de tal
manera que una señal de multicanal reconstruida puede ser formada
utilizando uno o más canales de mezcla descendente derivados de la
señal de multicanal y el uno o más parámetros;
un codificador residual para generar una señal
residual codificada en base a la señal de multicanal original, el
uno o más canales de mezcla descendente o el uno o más parámetros,
de tal manera que la señal de multicanal reconstruida, cuando es
formada utilizando la señal residual es más similar a la señal de
multicanal original que cuando es formada sin usar la señal
residual, el codificador residual incluye un descodificador de
multicanal para generar una señal de multicanal descodificada
utilizando el uno o más canales de mezcla descendente y el uno o
más parámetros; un calculador de error para calcular una
representación de señal de error de multicanal en base a la señal
de multicanal descodificada y la señal de multicanal original y un
procesador residual para procesar la representación de señal de
error de multicanal para obtener la señal residual codificada,
y
un formador de corriente de datos para formar
una corriente de datos que tiene la señal residual codificada y el
uno o más parámetros.
2. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque el formador de
corriente de datos es operativo para formar una corriente de datos
escalable, en la cual el uno o más parámetros y la señal residual
están en capas de escalamiento diferentes.
3. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque el codificador
residual es operativo para calcular la señal residual codificada
como una señal residual de forma de onda.
4. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque el codificador
residual es operativo para generar la señal residual en base al uno
o más parámetros y la señal de multicanal original sin el uno o más
canales de mezcla descendente, de tal manera que la señal residual
tiene una energía más pequeña en comparación con la generación de
la señal residual sin usar el uno o más parámetros.
5. El codificador de multicanal de conformidad
con la reivindicación 4, caracterizado porque el proveedor
de parámetros comprende:
un calculador de alineación para calcular un
parámetro de alineación de tiempo a ser provisto a un alineador de
tiempo para alinear un primer canal y un segundo canal de los por lo
menos dos canales o
un calculador de ganancia para calcular una
ganancia no igual a 1 para ponderar un canal, de tal manera que una
diferencia entre dos canales es reducida en comparación con un valor
de ganancia de uno.
6. El codificador de multicanal de conformidad
con la reivindicación 5, caracterizado porque el codificador
residual es operativo para calcular y codificar una señal de
diferencia derivada de un primer canal y un segundo canal alineado
o ponderado.
7. El codificador de multicanal de conformidad
con la reivindicación 5, caracterizado porque comprende
además un mezclador descendente para generar un canal de mezcla
descendente utilizando los canales alineados.
8. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque comprende
además un banco de filtro de análisis para dividir la señal de
multicanal a una pluralidad de bandas de frecuencia,
en donde el proveedor de parámetros y el
codificador residual son operativos para operar sobre las señales
de sub-banda, y
en donde el formador de corriente de datos es
operativo para recolectar señales residuales codificadas y
parámetros para una pluralidad de bandas de frecuencia.
9. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque el procesador
residual incluye un codificador de multicanal para generar una
representación de multicanal de la representación de señal de error
de multicanal.
10. El codificador de multicanal de conformidad
con la reivindicación 9, caracterizado porque el procesador
residual es operativo para generar adicionalmente uno o más canales
de mezcla descendente de la representación de señal de error de
multicanal.
\newpage
11. El codificador de multicanal de conformidad
con la reivindicación 1, caracterizado porque el proveedor
de parámetros es operativo para proporcionar parámetros de
codificación de indicación binaural (BCC) tales como diferencias de
nivel de intercanal, parámetros de coherencia intercanal,
diferencias de tiempo intercanal o indicaciones de envolvente de
canal.
12. Un método de codificación de una señal de
multicanal original que tiene por lo menos dos canales,
caracterizado porque comprende:
proporcionar uno o más parámetros, el uno o más
parámetros son formados de tal manera que una señal de multicanal
reconstruida puede ser formada utilizando uno o más canales de
mezcla descendente derivados de la señal de multicanal y el uno o
más parámetros;
generar una señal residual codificada en base a
la señal de multicanal original, el uno o más canales de mezcla
descendente o el uno o más parámetros, de tal manera que la señal de
multicanal reconstruida, cuando es formada utilizando la señal
residual es más similar a la señal de multicanal original que cuando
es formada sin usar la señal residual, la etapa de generación
incluye generar una señal de multicanal descodificada utilizando el
uno o más canales de mezcla descendente y el uno o más parámetros,
calcular una representación de señal de error de multicanal en base
a la señal de multicanal descodificada y la señal de multicanal
original; y procesar la representación de señal de error de
multicanal para obtener la señal residual codificada, y
formar una corriente de datos que tiene la señal
residual codificada y el uno o más parámetros.
13. Un descodificador de multicanal para
descodificar una señal de multicanal codificada que tiene uno o más
canales de mezcla descendente, uno o más parámetros y una señal
residual codificada, el uno o más canales de mezcla descendente
dependen de un parámetro de alineación o un parámetro de ganancia,
caracterizado porque compren-
de:
de:
un descodificador residual para generar una
señal residual descodificada en base a la señal residual
codificada,
y
y
un descodificador de multicanal para generar una
primera señal de multicanal reconstruida utilizando uno o más
canales de mezcla descendente y el uno o más parámetros,
en donde el descodificador de multicanal es
operativo adicionalmente para generar una segunda señal de
multicanal reconstruida utilizando el uno o más canales de mezcla
descendente y la señal residual descodificada,
en donde el descodificador de multicanal es
operativo adicionalmente para ponderar el canal de mezcla
descendente utilizando el parámetro de ganancia, para agregar la
señal residual descodificada a un canal de mezcla descendente
ponderado y para ponderar otra vez un canal resultante para obtener
la primera señal de multicanal reconstruida y para restar la señal
residual descodificada del canal de mezcla descendente y ponderar un
canal resultante de la sustracción utilizando el parámetro de
ganancia o para desalinear una diferencia entre el canal de mezcla
descendente y la señal residual descodificada cuando se obtiene la
segunda señal de multicanal reconstruida.
14. El descodificador de multicanal de
conformidad con la reivindicación 13, caracterizado porque la
señal de multicanal codificada es representada por una corriente de
datos escalada, la corriente de datos escalada tiene una primera
capa de escalamiento que incluye el uno o más parámetros y una
segunda capa de escalamiento que incluye la señal residual
codificada,
en donde el codificador de multicanal comprende
además:
un analizador sintáctico de corriente de datos
para extraer la primer capa de escalamiento o la segunda capa de
escalamiento.
15. El descodificador de multicanal de
conformidad con la reivindicación 13, caracterizado porque la
señal residual codificada depende del uno o más parámetros, y
en el cual el descodificador de multicanal es
operativo para usar el uno o más canales de mezcla descendente, el
uno o más parámetros y la señal residual descodificada para generar
la segunda señal de multicanal reconstruida.
16. El descodificador de multicanal de
conformidad con la reivindicación 13, caracterizado porque el
canal de mezcla descendente depende de un parámetro de alineación o
un parámetro de ganancia, y
en el cual el descodificador de multicanal es
operativo para ponderar el canal de mezcla descendente utilizando
una primera regla de ponderación basada en el parámetro de ganancia
y para ponderar el canal de mezcla descendente utilizando una
segunda regla de ponderación que utiliza el parámetro de ganancia
o
desalinear un canal de salida con respecto al
otro canal de salida utilizando el parámetro de alineación.
17. El descodificador de multicanal de
conformidad con la reivindicación 13, caracterizado porque
los parámetros incluyen parámetros de codificación de indicación
binaural (BCC) tales como diferencias de nivel de intercanal,
parámetros de coherencia de intercanal, diferencias de tiempo de
intercanal o indicaciones de envolvente de canal, y
en el cual el descodificador de multicanal es
operativo para efectuar una operación de descodificación de
multicanal de acuerdo con un esquema de codificación de indicación
binaural (BCC).
18. El descodificador de multicanal de
conformidad con la reivindicación 13, caracterizado porque el
uno o más canales de mezcla descendente, el uno o más parámetros y
la señal residual codificada son representados mediante datos
sub-banda-específicos, que
comprenden además:
un banco de filtro de síntesis para combinar
datos de sub-banda reconstruidos generados mediante
el descodificador de multicanal para obtener una representación de
plena banda de la primera o la segunda señal de multicanal
reconstruida.
19. Un método de descodificación de una señal de
multicanal codificada que tiene uno o más canales de mezcla
descendente, uno o más parámetros y una señal residual codificada,
caracterizado porque comprende:
generar una señal residual descodificada en base
a la señal residual codificada, y
generar una primera señal de multicanal
reconstruida utilizando uno o más canales de mezcla descendente y
el uno o más parámetros y generar una segunda señal de multicanal
reconstruida utilizando el uno o más canales de mezcla descendente
y la señal residual descodificada, la etapa de generación incluye
ponderación del canal de mezcla descendente utilizando el parámetro
de ganancia, agregar la señal residual descodificada a un canal de
mezcla descendente ponderado y ponderar otra vez un canal resultante
para obtener la primera señal de multicanal reconstruida y restar
la señal residual descodificada del canal de mezcla descendente y
ponderar un canal resultante de la sustracción utilizando el
parámetro de ganancia o desalinear una diferencia entre el canal de
mezcla descendente y la señal residual descodificada cuando se
obtiene la segunda señal de multicanal reconstruida.
20. Un codificador de multicanal para codificar
una señal de multicanal original que tiene por lo menos dos
canales, caracterizado porque comprende:
un alineador de tiempo para alinear un primer
canal y un segundo canal de los por lo menos dos canales utilizando
un parámetro de alineación;
un mezclador descendente para generar un canal
de mezcla descendente utilizando los canales alineados;
un calculador de ganancia para calcular un
parámetro de ganancia no igual a uno para ponderar un canal
alineado, de tal manera que la diferencia entre los canales
alineados es reducida en comparación con un valor de ganancia de 1,
y
un formador de corriente de datos para formar
una corriente de datos que tiene información en cuanto al canal de
mezcla descendente, información en cuanto al parámetro de alineación
e información en cuanto al parámetro de ganancia.
21. El codificador de multicanal de conformidad
con la reivindicación 20, caracterizado porque comprende
además un codificador residual para calcular y codificar una señal
de diferencia derivada del primer canal y un segundo canal alineado
y ponderado,
en donde el formador de corriente de datos es
operativo además para incluir una señal residual codificada a la
corriente de datos.
22. Un descodificador de multicanal para
descodificar una señal de multicanal codificada que tiene
información en cuanto a uno o más canales de mezcla descendente,
información en cuanto a un parámetro de ganancia, información en
cuanto a un parámetro de alineación y una señal residual codificada,
caracterizado porque comprende: un descodificador de canal
de mezcla descendente para generar un canal de mezcla descendente
descodificado;
un procesador para procesar el canal de mezcla
descendente descodificado utilizando el parámetro de ganancia para
obtener un primer canal de salida descodificado y para procesar el
canal de mezcla descendente descodificado utilizando el parámetro
de ganancia y para desalinear utilizando el parámetro de alineación
para obtener un segundo canal de salida descodificado, y
un descodificador residual para generar una
señal residual descodificada,
en donde el procesador es operativo para
ponderar principalmente el canal de mezcla descendente utilizando
el parámetro de ganancia, para agregar la señal residual
descodificada y para ponderar en segundo lugar utilizando el
parámetro de ganancia para obtener un primer canal reconstruido y
para restar la señal residual descodificada del canal de mezcla
descendente antes de la ponderación y para desalinear para obtener
el segundo canal reconstruido.
23. Un método de codificación de una señal de
multicanal original que tiene por lo menos dos canales,
caracterizado porque comprende:
alinear en el tiempo un primer canal y un
segundo canal de los por lo menos dos canales utilizando un
parámetro de alineación;
generar un canal de mezcla descendente
utilizando los canales alineados;
calcular un parámetro de ganancia no igual a uno
para ponderar un canal alineado, de tal manera que la diferencia
entre los canales alineados es reducida en comparación con un valor
de ganancia de 1, y
formar una corriente de datos que tiene
información en cuanto al canal de mezcla descendente, información
en cuanto al parámetro de alineación e información en cuanto al
parámetro de ganancia.
24. Un método para descodificar una señal de
multicanal codificada que tiene información en cuanto a uno o más
canales de mezcla descendente, información en cuanto a un parámetro
de ganancia, información en cuanto a un parámetro de alineación y
una señal residual codificada, caracterizado porque
comprende:
generar un canal de mezcla descendente
descodificado;
procesar el canal de mezcla descendente
descodificado utilizando el parámetro de ganancia para obtener un
primer canal de salida descodificado y procesar el canal de mezcla
descendente descodificado utilizando el parámetro de ganancia y una
desalineación en base al parámetro de alineación para obtener un
segundo canal de salida descodificado, y
descodificar la señal residual codificada para
obtener una señal residual descodificada,
en donde la etapa de procesamiento incluye
principalmente ponderar el canal de mezcla descendente utilizando
el parámetro de ganancia, agregar la señal residual descodificada y
en segundo lugar ponderación utilizando el parámetro de ganancia
para obtener un primer canal reconstruido y restar la señal residual
descodificada del canal de mezcla descendente antes de la
ponderación y desalineación para obtener el segundo canal
reconstruido.
25. Una señal de multicanal codificada
caracterizada porque tiene información en cuanto a uno o más
canales de mezcla descendente, uno o más parámetros resultantes,
cuando son combinados con el uno o más canales de mezcla
descendente, en una primera señal de multicanal reconstruida y una
señal residual codificada resultante, cuando son combinadas con el
uno o más canales de mezcla descendente, en una segunda señal de
multicanal reconstruida, en donde la segunda señal de multicanal
reconstruida es más similar a una señal de multicanal original que
la primera señal de multicanal reconstruida, en donde la señal de
multicanal codificada es una corriente de datos escalable, en la
cual el uno o más parámetros y la señal residual están en diferentes
capas de escalamiento o el uno o más parámetros incluyen parámetros
de codificación de indicación binaural (BCC) tales como diferencias
de nivel de intercanal, parámetros de coherencia de intercanal,
diferencias de tiempo de intercanal o indicaciones de envolvente de
canal.
26. Un programa de computadora,
caracterizado porque efectúa, cuando se ejecuta en una
computadora, el método de conformidad con cualquiera de las
reivindicaciones 12, 19, 23 ó 24.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US65521605P | 2005-02-22 | 2005-02-22 | |
US655216P | 2005-02-22 | ||
US11/080,775 US7573912B2 (en) | 2005-02-22 | 2005-03-14 | Near-transparent or transparent multi-channel encoder/decoder scheme |
US80775 | 2005-03-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2312025T3 true ES2312025T3 (es) | 2009-02-16 |
Family
ID=35519868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05797659T Active ES2312025T3 (es) | 2005-02-22 | 2005-10-04 | Esquema de codificador/descodificador de multicanal casi transparente o transparente. |
Country Status (19)
Country | Link |
---|---|
US (1) | US7573912B2 (es) |
EP (1) | EP1851997B1 (es) |
JP (1) | JP4887307B2 (es) |
KR (1) | KR100954179B1 (es) |
CN (2) | CN101120615B (es) |
AT (1) | ATE406076T1 (es) |
AU (1) | AU2005328264B2 (es) |
BR (1) | BRPI0520053B1 (es) |
CA (1) | CA2598541C (es) |
DE (1) | DE602005009262D1 (es) |
ES (1) | ES2312025T3 (es) |
HK (1) | HK1107495A1 (es) |
IL (1) | IL185304A0 (es) |
MX (1) | MX2007009887A (es) |
NO (1) | NO339907B1 (es) |
PL (1) | PL1851997T3 (es) |
PT (1) | PT1851997E (es) |
RU (1) | RU2388176C2 (es) |
WO (1) | WO2006089570A1 (es) |
Families Citing this family (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1973320B (zh) * | 2004-04-05 | 2010-12-15 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
ES2373728T3 (es) * | 2004-07-14 | 2012-02-08 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio. |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
MX2007005261A (es) * | 2004-11-04 | 2007-07-09 | Koninkl Philips Electronics Nv | Codificacion y descodificacion de un conjunto de senales. |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
JP4887288B2 (ja) * | 2005-03-25 | 2012-02-29 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
EP1866911B1 (en) * | 2005-03-30 | 2010-06-09 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
CN101151660B (zh) * | 2005-03-30 | 2011-10-19 | 皇家飞利浦电子股份有限公司 | 多通道音频编码器、解码器以及相应方法 |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
EP1905002B1 (en) * | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
JP2008542816A (ja) * | 2005-05-26 | 2008-11-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化及び復号化方法 |
AU2006266579B2 (en) * | 2005-06-30 | 2009-10-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
JP2009500656A (ja) * | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US7761303B2 (en) * | 2005-08-30 | 2010-07-20 | Lg Electronics Inc. | Slot position coding of TTT syntax of spatial audio coding application |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
KR101169280B1 (ko) * | 2005-08-30 | 2012-08-02 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
CN101253556B (zh) * | 2005-09-02 | 2011-06-22 | 松下电器产业株式会社 | 能量整形装置以及能量整形方法 |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100857121B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
EP1946062A4 (en) * | 2005-10-05 | 2009-09-09 | Lg Electronics Inc | METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US20070092086A1 (en) * | 2005-10-24 | 2007-04-26 | Pang Hee S | Removing time delays in signal paths |
US8112286B2 (en) * | 2005-10-31 | 2012-02-07 | Panasonic Corporation | Stereo encoding device, and stereo signal predicting method |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
EP1974347B1 (en) * | 2006-01-19 | 2014-08-06 | LG Electronics Inc. | Method and apparatus for processing a media signal |
CN102693727B (zh) * | 2006-02-03 | 2015-06-10 | 韩国电子通信研究院 | 用于控制音频信号的渲染的方法 |
WO2007091850A1 (en) * | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
BRPI0706488A2 (pt) * | 2006-02-23 | 2011-03-29 | Lg Electronics Inc | método e aparelho para processar sinal de áudio |
US7835904B2 (en) * | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
KR100773562B1 (ko) * | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
RU2551797C2 (ru) | 2006-09-29 | 2015-05-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов |
EP2054875B1 (en) * | 2006-10-16 | 2011-03-23 | Dolby Sweden AB | Enhanced coding and parameter representation of multichannel downmixed object coding |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
US8571875B2 (en) * | 2006-10-18 | 2013-10-29 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus encoding and/or decoding multichannel audio signals |
WO2008069584A2 (en) * | 2006-12-07 | 2008-06-12 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
EP2111618A4 (en) * | 2007-02-13 | 2010-04-21 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL |
JP2010521866A (ja) | 2007-03-16 | 2010-06-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
GB0705328D0 (en) * | 2007-03-20 | 2007-04-25 | Skype Ltd | Method of transmitting data in a communication system |
EP3712888B1 (en) * | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
JP5291096B2 (ja) * | 2007-06-08 | 2013-09-18 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
CN101802907B (zh) * | 2007-09-19 | 2013-11-13 | 爱立信电话股份有限公司 | 多信道音频的联合增强 |
GB2453117B (en) | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
MX2010004138A (es) * | 2007-10-17 | 2010-04-30 | Ten Forschung Ev Fraunhofer | Codificacion de audio usando conversion de estereo a multicanal. |
CA2705968C (en) * | 2007-11-21 | 2016-01-26 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8566108B2 (en) * | 2007-12-03 | 2013-10-22 | Nokia Corporation | Synchronization of multiple real-time transport protocol sessions |
US20100290629A1 (en) * | 2007-12-21 | 2010-11-18 | Panasonic Corporation | Stereo signal converter, stereo signal inverter, and method therefor |
ES2401817T3 (es) * | 2008-01-31 | 2013-04-24 | Agency For Science, Technology And Research | Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
CN102037507B (zh) * | 2008-05-23 | 2013-02-06 | 皇家飞利浦电子股份有限公司 | 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
US8315396B2 (en) * | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
AU2013200578B2 (en) * | 2008-07-17 | 2015-07-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
WO2010017833A1 (en) * | 2008-08-11 | 2010-02-18 | Nokia Corporation | Multichannel audio coder and decoder |
US9330671B2 (en) * | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
WO2010091736A1 (en) * | 2009-02-13 | 2010-08-19 | Nokia Corporation | Ambience coding and decoding for audio applications |
WO2010091555A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
CN101826326B (zh) * | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
AU2015246158B2 (en) * | 2009-03-17 | 2017-10-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding. |
AU2013206557B2 (en) * | 2009-03-17 | 2015-11-12 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
BR122019023924B1 (pt) * | 2009-03-17 | 2021-06-01 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
EP2413314A4 (en) * | 2009-03-24 | 2012-02-01 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR SWITCHING ON A SIGNAL DELAY |
CN101533641B (zh) * | 2009-04-20 | 2011-07-20 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法和装置 |
GB2470059A (en) * | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP5793675B2 (ja) * | 2009-07-31 | 2015-10-14 | パナソニックIpマネジメント株式会社 | 符号化装置および復号装置 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
JP5345024B2 (ja) * | 2009-08-28 | 2013-11-20 | 日本放送協会 | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
WO2011029984A1 (en) * | 2009-09-11 | 2011-03-17 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
JP5511848B2 (ja) * | 2009-12-28 | 2014-06-04 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
JP5333257B2 (ja) * | 2010-01-20 | 2013-11-06 | 富士通株式会社 | 符号化装置、符号化システムおよび符号化方法 |
EP2369861B1 (en) * | 2010-03-25 | 2016-07-27 | Nxp B.V. | Multi-channel audio signal processing |
JP5604933B2 (ja) * | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
RU2683175C2 (ru) | 2010-04-09 | 2019-03-26 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
US8948403B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system |
JP5581449B2 (ja) * | 2010-08-24 | 2014-08-27 | ドルビー・インターナショナル・アーベー | Fmステレオ無線受信機の断続的モノラル受信の隠蔽 |
WO2012040898A1 (en) | 2010-09-28 | 2012-04-05 | Huawei Technologies Co., Ltd. | Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal |
JP5949270B2 (ja) * | 2012-07-24 | 2016-07-06 | 富士通株式会社 | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム |
KR20140017338A (ko) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
RU2628900C2 (ru) * | 2012-08-10 | 2017-08-22 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов |
JP2015534116A (ja) * | 2012-09-14 | 2015-11-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル・オーディオ・コンテンツ解析に基づく上方混合検出 |
EP2757559A1 (en) * | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
KR20230020553A (ko) | 2013-04-05 | 2023-02-10 | 돌비 인터네셔널 에이비 | 스테레오 오디오 인코더 및 디코더 |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
CN105393304B (zh) * | 2013-05-24 | 2019-05-28 | 杜比国际公司 | 音频编码和解码方法、介质以及音频编码器和解码器 |
SG11201510164RA (en) | 2013-06-10 | 2016-01-28 | Fraunhofer Ges Forschung | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
PT3008726T (pt) | 2013-06-10 | 2017-11-24 | Fraunhofer Ges Forschung | Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
EP2854133A1 (en) * | 2013-09-27 | 2015-04-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generation of a downmix signal |
PL3800898T3 (pl) * | 2014-05-28 | 2023-12-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Procesor danych i transport danych kontrolnych użytkownika do dekoderów audio i modułów renderowania |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
CA2997334A1 (en) | 2015-09-25 | 2017-03-30 | Voiceage Corporation | Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget |
PL3405949T3 (pl) | 2016-01-22 | 2020-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób szacowania międzykanałowej różnicy czasowej |
US10210871B2 (en) * | 2016-03-18 | 2019-02-19 | Qualcomm Incorporated | Audio processing for temporally mismatched signals |
CN106162180A (zh) * | 2016-06-30 | 2016-11-23 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
BR112019009424A2 (pt) | 2016-11-08 | 2019-07-30 | Fraunhofer Ges Forschung | mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio |
CA3127805C (en) * | 2016-11-08 | 2023-12-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain |
CN109215667B (zh) | 2017-06-29 | 2020-12-22 | 华为技术有限公司 | 时延估计方法及装置 |
RU2762302C1 (ru) | 2018-04-05 | 2021-12-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство, способ или компьютерная программа для оценки разности во времени между каналами |
CN110556117B (zh) * | 2018-05-31 | 2022-04-22 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN110403582B (zh) * | 2019-07-23 | 2021-12-03 | 宏人仁医医疗器械设备(东莞)有限公司 | 一种用于分析脉波波形品质的方法 |
GB2623516A (en) * | 2022-10-17 | 2024-04-24 | Nokia Technologies Oy | Parametric spatial audio encoding |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
JP2852862B2 (ja) * | 1994-02-01 | 1999-02-03 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | Pcmオーディオ信号の変換方法と装置 |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
AU2003212604A1 (en) | 2002-04-09 | 2003-10-20 | Koninklijke Philips Electronics N.V. | Compound objective lens with fold mirror |
ES2341327T3 (es) * | 2002-04-10 | 2010-06-18 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de señales audio multicanal. |
US8498422B2 (en) | 2002-04-22 | 2013-07-30 | Koninklijke Philips N.V. | Parametric multi-channel audio representation |
AU2003216682A1 (en) * | 2002-04-22 | 2003-11-03 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
ES2323294T3 (es) * | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
WO2004008806A1 (en) | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
JPWO2005081229A1 (ja) * | 2004-02-25 | 2007-10-25 | 松下電器産業株式会社 | オーディオエンコーダ及びオーディオデコーダ |
WO2005086139A1 (en) * | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
-
2005
- 2005-03-14 US US11/080,775 patent/US7573912B2/en active Active
- 2005-10-04 JP JP2007555459A patent/JP4887307B2/ja active Active
- 2005-10-04 KR KR1020077018991A patent/KR100954179B1/ko active IP Right Grant
- 2005-10-04 PT PT05797659T patent/PT1851997E/pt unknown
- 2005-10-04 CN CN2005800482910A patent/CN101120615B/zh active Active
- 2005-10-04 DE DE602005009262T patent/DE602005009262D1/de active Active
- 2005-10-04 EP EP05797659A patent/EP1851997B1/en active Active
- 2005-10-04 AU AU2005328264A patent/AU2005328264B2/en active Active
- 2005-10-04 AT AT05797659T patent/ATE406076T1/de active
- 2005-10-04 PL PL05797659T patent/PL1851997T3/pl unknown
- 2005-10-04 RU RU2007135178/09A patent/RU2388176C2/ru active
- 2005-10-04 CA CA2598541A patent/CA2598541C/en active Active
- 2005-10-04 ES ES05797659T patent/ES2312025T3/es active Active
- 2005-10-04 MX MX2007009887A patent/MX2007009887A/es active IP Right Grant
- 2005-10-04 BR BRPI0520053-9A patent/BRPI0520053B1/pt active IP Right Grant
- 2005-10-04 CN CN2011102311266A patent/CN102270452B/zh active Active
- 2005-10-04 WO PCT/EP2005/010685 patent/WO2006089570A1/en active IP Right Grant
-
2007
- 2007-08-15 IL IL185304A patent/IL185304A0/en active IP Right Grant
- 2007-09-21 NO NO20074829A patent/NO339907B1/no unknown
-
2008
- 2008-01-24 HK HK08100973A patent/HK1107495A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
DE602005009262D1 (de) | 2008-10-02 |
CN102270452B (zh) | 2013-11-13 |
CA2598541A1 (en) | 2006-08-31 |
EP1851997A1 (en) | 2007-11-07 |
AU2005328264B2 (en) | 2009-03-26 |
JP2008530616A (ja) | 2008-08-07 |
CN101120615A (zh) | 2008-02-06 |
RU2388176C2 (ru) | 2010-04-27 |
HK1107495A1 (en) | 2008-04-03 |
WO2006089570A1 (en) | 2006-08-31 |
AU2005328264A1 (en) | 2006-08-31 |
PL1851997T3 (pl) | 2009-01-30 |
ATE406076T1 (de) | 2008-09-15 |
BRPI0520053B1 (pt) | 2019-02-19 |
PT1851997E (pt) | 2008-12-04 |
KR20070098930A (ko) | 2007-10-05 |
EP1851997B1 (en) | 2008-08-20 |
US20060190247A1 (en) | 2006-08-24 |
CA2598541C (en) | 2012-08-14 |
US7573912B2 (en) | 2009-08-11 |
KR100954179B1 (ko) | 2010-04-21 |
NO20074829L (no) | 2007-09-21 |
BRPI0520053A2 (pt) | 2009-04-14 |
JP4887307B2 (ja) | 2012-02-29 |
NO339907B1 (no) | 2017-02-13 |
RU2007135178A (ru) | 2009-03-27 |
IL185304A0 (en) | 2008-02-09 |
MX2007009887A (es) | 2007-09-07 |
CN101120615B (zh) | 2012-05-23 |
CN102270452A (zh) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2312025T3 (es) | Esquema de codificador/descodificador de multicanal casi transparente o transparente. | |
KR102230727B1 (ko) | 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
ES2733878T3 (es) | Codificación mejorada de señales de audio digitales multicanales | |
JP7106711B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ | |
JP5185340B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
AU2005259618B2 (en) | Multi-channel synthesizer and method for generating a multi-channel output signal | |
KR20200091880A (ko) | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
NO342804B1 (no) | Kompatibel flerkanal-koding/dekoding | |
TWI792006B (zh) | 音訊合成器、訊號產生方法及儲存單元 | |
JP7035154B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器 | |
TWI843389B (zh) | 音訊編碼器、降混訊號產生方法及非暫時性儲存單元 | |
ES2439693T3 (es) | Codificación de señales de múltiples canales |