ES2286714T3 - Ocultacion de errores en sistemas multicanales de audio. - Google Patents
Ocultacion de errores en sistemas multicanales de audio. Download PDFInfo
- Publication number
- ES2286714T3 ES2286714T3 ES04809050T ES04809050T ES2286714T3 ES 2286714 T3 ES2286714 T3 ES 2286714T3 ES 04809050 T ES04809050 T ES 04809050T ES 04809050 T ES04809050 T ES 04809050T ES 2286714 T3 ES2286714 T3 ES 2286714T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- channel
- signals
- parameters
- parts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 88
- 230000005236 sound signal Effects 0.000 claims description 26
- 238000011835 investigation Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- 230000002950 deficient Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 3
- 229920002554 vinyl polymer Polymers 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Amplifiers (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
Método para recuperar componentes erróneos de señales multicanal (x1 - xN) de audio que utilizan correlaciones entre canales, caracterizado por los pasos de: obtener y almacenar, en un procedimiento de optimización, en condiciones libres de errores, para una señal (x1 - xN) de canal predeterminada, unos parámetros hk de un modelo paramétrico (27) que da una estimación de una parte de la señal (x1 - xN) de canal predeterminada, cuando se aplica para obtener una señal de entrada; detectar si al menos una parte de la señal de canal es errónea; y generar, cuando una parte de la señal (x1 - xN) de canal predeterminada es errónea, una parte de señal de sustitución para la parte errónea de la señal (x1 - xN) de canal predeterminada, aplicando el modelo paramétrico (25) basándose en los parámetros (hk) almacenados, asociados con una señal precedente libre de errores, para generar una señal de entrada.
Description
Ocultación de errores en sistemas multicanales
de audio.
La presente invención está relacionada en
general con métodos y dispositivos de sistemas de audio de múltiples
canales y, en particular, con métodos y dispositivos para ocultar
señales de canales erróneos.
Hay un gran interés en gestionar señales de
audio y, en particular, señales de audio de múltiples canales. Las
señales de audio se consiguen por grabaciones directas, o por
generación de sonido estereofónico, o bien como una recuperación de
representaciones anteriores de señales de audio almacenadas, y
transmitidas de alguna manera a una unidad final, tal como un
sistema de altavoces o a un almacén de señales de audio. En los
sistemas de señales digitales, las señales de audio son codificadas
típicamente antes de ser transmitidas, y descodificadas en el lado
del receptor.
La codificación paramétrica se ha encontrado muy
atractiva, ya que la velocidad en bits para transmitir datos en
múltiples canales puede reducirse significativamente en comparación
con meras codificaciones de la forma de onda. Existen varios
ejemplos de esquemas de codificación paramétrica en la técnica
anterior.
Independientemente del método de transmisión que
se utilice, los sistemas de comunicaciones están típicamente
asociados con canales de transmisión propensos a errores, por
ejemplo, en comunicaciones inalámbricas o a través de Internet.
Existen varios niveles para combatir señales recibidas erróneamente.
Directamente en la capa de transmisión, existen rutinas de manejo
de errores, tales como la corrección de errores sin retorno (FEC) y
los esquemas de retransmisión, que intentan compensar ciertos tipos
de errores inducidos en la transmisión. Sin embargo, algunos
errores no puede ser totalmente corregidos por tales esquemas de
errores de la transmisión, y los descodificadores, en el caso de
señales digitales, han de ser configurados para recibir también
señales defectuosas o incluso asumir la pérdida de partes de la
señal. Típicamente, los descodificadores recibirán datos
codificados que corresponden a tramas de la señal de entrada, y
existe típicamente un señalizador que indica si los datos de la
trama están libres de errores o son defectuosos o se han perdido, es
decir, son inutilizables. En el caso de datos inutilizables, el
descodificador no podrá descodificar y reconstruir la
correspondiente trama de la señal. En lugar de eso, se dispondrán
medios para ocultar la pérdida de tramas y hacer que la pérdida sea
tan inaudible como sea posible.
En el caso de señales de audio estereofónicas o
de múltiples canales, la pérdida de tramas puede afectar
específicamente la representación de audio en estéreo o en
múltiples canales. Por ejemplo, si uno de los canales transmitidos
está afectado, el descodificador puede seguir siendo capaz de
reconstruir el otro canal o, dependiendo de la representación
equivalente elegida, puede seguir siendo posible reconstruir una
señal monofónica. Sin embargo, una pérdida repentina de uno de los
canales de audio, así como por ejemplo el cambio brusco de una señal
estéreo a una señal monofónica, perjudicará la calidad percibida
del audio. Una parte importante de la ocultación de errores del
códec de audio es por tanto mitigar las pérdidas de la información
estereofónica o de múltiples canales.
La mayoría de los métodos de ocultación de
pérdidas de la señal de la técnica anterior están directamente
relacionados con el tipo de codificación utilizada durante la etapa
de transmisión. Dependiendo del tipo de códec de audio, paramétrico
o no paramétrico, existen varias maneras de efectuar la ocultación
de errores para los códecs de audio en general, incluyendo los que
son para audio estereofónico o de múltiples canales. Es común a
todos ellos el hecho de realizar intentos de ocultación durante el
propio proceso de descodificación o en relación directa con él.
Los códecs de audio no paramétricos repetirán
típicamente o estimarán, por ejemplo por medio de valores de
interpolación de la señal recibida correctamente, con el fin de
generar una sustitución de los valores erróneos. Como ejemplo, la
patente de Estados Unidos 6.490.551 de Wiese y otros colaboradores,
muestra cómo sustituir componentes espectrales perdidos por
estimaciones (por ejemplo, por interpolación) a partir de
componentes correspondientes del mismo o de otro canal (estéreo)
que incluyen valores muestreados en el dominio de tiempos o de
frecuencias. El mérito de esta patente es que, según reivindica,
mantiene la impresión estereofónica.
Otra técnica similar, particularmente para
señales estéreo, está descrita en la patente DE 3638922, de acuerdo
con la cual las secciones de señal perdidas de uno de los canales
estéreo son sustituidas por las correspondientes secciones de la
señal del otro canal.
La ocultación típica de la pérdida de tramas en
los códecs paramétricos de audio implica la sustitución de un
parámetro erróneo por un parámetro correspondiente anterior y
recibido correctamente. Esta es una técnica temporal ampliamente
utilizada en los códecs de habla, que es directamente aplicable a
los códecs paramétricos de audio. Está descrito en detalle, por
ejemplo, en la especificación 3GPP sobre ocultación de errores de
tramas perdidas para el códec de habla AMR, 3GPP TS 26.091,
cláusulas 6 y 7.
La patente EP 0 637 013, de Cluever, describe un
método paramétrico de ocultación de pérdida de tramas para códecs
de habla monofónicos no paramétricos. Los valores de la señal de una
trama de habla recibida correctamente, son utilizados para obtener
los parámetros del modelo de síntesis del habla. En caso de una
pérdida de trama, la trama de habla que falta es sintetizada
aplicando ese modelo y utilizando los parámetros obtenidos durante
la última trama de habla válida. Tal técnica podría ser aplicada en
principio para la ocultación de errores en los códecs de audio, y
en el caso de múltiples canales, canal por canal.
En el artículo "Codificación de señales de
indicación biaurales - Parte II: Esquemas y aplicaciones", de C.
Faller y F. Baumgarte, en IEEE Transactions on Speech and Audio
Processing, VOL. 11, núm. 6, páginas 520-531, se
divulga la codificación de señales de indicación biaurales en
contextos generales.
Entre los métodos de ocultación estudiados
anteriormente, la mayor parte de las soluciones restauran los
canales transmitidos en sistemas de audio de múltiples canales,
independientes entre sí, ignorando cualquier dependencia
estadística entre canales. Los métodos de los documentos US
6.490.551 y DE 3638922 aprovechan explícitamente las dependencias
entre canales, pero son limitados como soluciones de códecs no
paramétricos. Más aún, emplean un principio de repetición o
estimación de interpolación de valores de señales recibidos
correctamente, con el fin de generar una sustitución de valores
erróneos, que típicamente no conducen a la mejor calidad
perceptiva.
Un objeto general de la presente invención es,
por tanto, proporcionar métodos y dispositivos mejorados para la
ocultación de pérdidas de señal del canal, permitiendo una
generación más precisa de señales de sustitución de componentes de
la señal ausentes o erróneos. Otro objeto de la presente invención
es proporcionar métodos y dispositivos de ocultación, que son
útiles junto con cualquier principio de codificación y, en
particular, con sistemas de codificación paramétrica.
Los objetos anteriores se consiguen con métodos
y dispositivos de acuerdo con las reivindicaciones de patente
adjuntas. En términos generales, se utiliza un modelo paramétrico,
que permite generar sustituciones de componentes perdidos o
erróneos de un canal de audio a partir de una señal de entrada.
Durante la recepción libre de errores de tramas válidas, se
obtendrán y almacenarán los parámetros de ese modelo. En el caso de
una perdida de trama o error de la trama, que afecte a la
información de múltiples canales, la información que falta o al
menos una presunción de la misma se recupera o genera aplicando el
modelo que utiliza los parámetros almacenados. La aplicación del
modelo puede implicar el filtrado de los componentes de la señal de
entrada de al menos otro canal de audio, o de alguna otra señal no
relacionada necesariamente con ninguna señal de audio. En el caso
de que se pierdan o sean erróneas varias tramas posteriores, es
posible utilizar los parámetros obtenidos durante la última trama
válida o utilizar parámetros obtenidos a partir de la información
multicanal recuperada de la respectiva trama no válida anterior.
También es posible combinar ambas técnicas, es decir, utilizar
parámetros que han sido obtenidos como combinación de parámetros
almacenados de la trama válida anterior con parámetros obtenidos a
partir de la información multicanal recuperada de la trama anterior
no válida. Más aún, si hay secuencias largas de tramas perdidas,
puede ser beneficioso aplicar cierto enmudecimiento gradual de los
parámetros del modelo, que esencialmente dan como resultado un
enmudecimiento gradual de los parámetros del modelo, lo cual da
como resultado esencialmente una atenuación gradual de la
información multicanal recuperada. En el caso de un enmudecimiento
completo, no se recuperará ninguna señal multicanal, lo cual da como
resultado una reincidencia de la reproducción única del canal
principal o monofónico de audio.
En el caso de pérdida no solamente de
información multicanal, sino también de información de la señal de
entrada, se aplica primero una técnica de ocultación temporal de
errores propia del estado de la técnica, para recuperar la señal de
entrada a partir de la información de la señal de entrada recibida
en un instante de tiempo anterior. Después, en una segunda etapa,
la ocultación de errores de acuerdo con la invención es aplicada
para generar una presunción de la información multicanal original,
a partir de la señal de entrada recuperada.
Más en general, la recuperación de información
multicanal de acuerdo con la invención puede ser combinada con
técnicas tradicionales de ocultación temporal de errores, que
recuperan información perdida de los mismos canales respectivos
basada en información recibida para estos canales en un instante de
tiempo anterior.
Una ventaja de la presente invención es que las
pérdidas de información multicanal pueden ser mitigadas de una
forma mejorada, ya que las correlaciones entre canales son
utilizadas para recuperar las señales originales de los canales.
Más aún, la invención es aplicable muy en general y puede ser
utilizada, por ejemplo, en sistemas de transmisión de señales de
audio de múltiples canales, utilizando cualquier tipo de técnica de
codificación, o en sistemas que ni siquiera utilizan codificación
de señales.
La invención, junto con ventajas y objetos
adicionales de la misma, puede comprenderse mejor haciendo
referencia a la descripción siguiente, tomada conjuntamente con los
dibujos que se acompañan, en los cuales:
Las figuras 1A-C son diagramas
de bloques esquemáticos de modos de realización de sistemas de
audio, se acuerdo con la presente invención;
La figura 2 es un esquema de bloques de un modo
de realización de un dispositivo de ocultación, de acuerdo con la
presente invención;
La figura 3 es un esquema de bloques de un modo
de realización de una sección de filtrado de canales, de acuerdo
con la presente invención;
La figura 4 es un esquema de bloques de otro
modo de realización de un dispositivo de ocultación, de acuerdo con
la presente invención;
Las figuras 5A-5B son diagramas
de flujo de las principales etapas de modos de realización de un
método, de acuerdo con la presente invención;
La figura 6 es un diagrama de flujo parcial que
ilustra una etapa de modos de realización de acuerdo con los
diagramas de las figuras 5A-B con más detalle;
Las figuras 7A-D son diagramas
que ilustran las correlaciones de datos de acuerdo con modos de
realización de la presente invención;
La figura 8 es un diagrama de bloques que
ilustra una implementación de un modo de realización de un
dispositivo de ocultación, de acuerdo con la presente invención,
integrado en un descodificador de filtro paramétrico; y
La figura 9 es un diagrama de bloques de un modo
de realización de un sistema de audio analógico, de acuerdo con la
presente invención.
En la presente divulgación, el término
"multi-canal" se utiliza para caracterizar más
de un canal. Por ejemplo, los sistemas de canales estereofónicos
están incluidos en el término de sistemas
"multi-canal". Una definición alternativa es
un sistema de n canales, donde n \geq 2.
Más aún, el término "señal errónea"
comprende toda clase de errores, incluyendo también la ausencia o
pérdida de señal.
Un lugar típico para un dispositivo de
ocultación es dentro o en la proximidad de un receptor o
descodificador. Sin embargo, la presente invención es debida a sus
partes características aplicables de forma más general, y puede ser
aplicada a casi cualquier lugar de los sistemas multicanales de
audio. Para ilustrar esto, la presente descripción detallada
comienza con unos cuantos ejemplos de sistemas, en los cuales la
presente invención es aplicable ventajosamente.
La figura 1A ilustra un modo de realización de
un sistema 1 de audio que está basado en señales digitales. Una
fuente 10 de señales multicanal recupera señales almacenadas desde
un almacenamiento 12 de señales de audio, que en este modo de
realización es un CD de señales codificadas digitalmente que
representan señales de audio. Las señales de audio multicanal son
transmitidas a través de las salidas 14 de la fuente. En un sistema
alternativo, las señales multicanal de audio podrían ser
proporcionadas también en tiempo real, como se indica con las
líneas de puntos, y un sistema de micrófonos 11.
En el proceso de proporcionar las señales de
audio, pueden ocurrir errores. El contenido de señal del disco 12
de CD podría estar deteriorado y ser difícil o imposible de
interpretar. El procedimiento de recuperación podría producir
también algunos errores de bits, dando total o parcialmente señales
de canal defectuosas. Un dispositivo 20 de ocultación de acuerdo
con la presente invención, podría ser por ello ser conectado
ventajosamente a las salidas 14 de la fuente. Las señales
multicanal "reparadas" son transmitidas después a las entradas
34 de destino, que en este modo de realización están conectadas a un
respectivo altavoz 30.
La figura 1B ilustra otro modo de realización de
un sistema 1 de audio, que en este caso está basada en una fuente
estéreo 10 de un tipo analógico. Un disco 12 de vinilo comprende
señales de audio codificadas como ondulaciones geométricas en
pistas del disco 10 de vinilo. Las señales de audio de canales
estéreo son suministradas, a través de las salidas 14 de la fuente,
a una unidad 13 de muestreo, la cual muestrea el sonido analógico y
lo representa digitalmente. En otras palabras, la unidad 13 de
muestreo funciona como un convertidor analógico a digital para las
señales de audio.
También en este proceso de proporcionar señales
de audio hay fuentes de errores. El contenido de la señal del disco
12 de vinilo podría ser mecánicamente alterado, por ejemplo, por
partículas o rascaduras. El procedimiento de recuperación podría
producir errores también que influencien significativamente la
calidad perceptiva. Finalmente, la conversión de analógico a
digital puede también dar lugar a señales de canal total o
parcialmente defectuosas. Un dispositivo 20 de ocultación, de
acuerdo con la presente invención, podría por eso ser ventajosamente
conectado a las salidas 14 de la fuente. Las señales multicanal
"reparadas" son transmitidas después nuevamente a entradas 34
de destino estéreo, que en este modo de realización están conectadas
a dos altavoces 30.
La figura 1C ilustra otro modo de realización de
un sistema 1 de audio. En este caso, se descargan algunas señales
de audio multicanal desde una fuente 10 de señales de audio
multicanal, que en este caso es un proveedor de piezas de música.
Las señales multicanal son recuperadas de la fuente 10 y
proporcionadas por una conexión multicanal 4 a un codificador 5. El
codificador 5 convierte las señales multicanal en una cadena de
datos comunes transmitidos a través de una conexión 6 a una unidad
7 transmisora de radio. Puede utilizarse cualquier tipo de
principios de codificación. La unidad 7 transmisora de radio prepara
la cadena de datos comunes para ser transmitida como señales 9 de
radio desde una antena emisora 8, a una antena receptora 15. Una
unidad 16 receptora de radio recibe las señales y proporciona una
versión tan correcta como sea posible de los datos comunes
originales, a través de una conexión 17 a un descodificador 18. El
descodificador 18 convierte la cadena de datos comunes de la
conexión 17 en diversas señales de canal, proporcionadas en las
salidas 14 de la fuente.
La parte de radio de este sistema es
probablemente el origen principal de los errores de las señales de
audio. Tanto el receptor 16 de radio como el descodificador 18
comprenden típicamente funcionalidades de manejo de errores más o
menos complicadas o dispositivos de ocultación. Sin embargo, un
dispositivo 20 de ocultación de acuerdo con la presente invención
podría ser ventajoso si se conectase a las salidas 14 de la fuente.
Las señales multicanal "reparadas" son transmitidas después
nuevamente a las entradas 34 multicanal de destino, que en este
modo de realización están conectadas a un almacén 31 de señales de
audio.
Las señales de audio transmitidas a través de
Internet están expuestas a menudo a errores de la transmisión. Se
aplica por tanto ventajosamente un dispositivo 20 de ocultación
correspondiente, sobre el lado de recepción de un sistema de
transmisión de audio basado en Internet.
El principio básico de la invención es que la
señal de un canal de un conjunto de señales multicanal, puede ser
reproducida con bastante precisión aplicando una filtro paramétrico
a una señal de entrada. La señal de entrada puede ser cualquier
señal, por ejemplo una señal de ruido. Sin embargo, en modos de
realización preferidos, la señal de entrada depende de una
combinación lineal de al menos una de las demás señales multicanal,
que da como resultado una señal "principal". La señal
principal puede ser una señal monofónica, es decir, una señal que
representa las señales de audio si fueran grabadas solamente por una
fuente (micrófono). Sin embargo, otros modos de realización
utilizan una señal principal que excluye la señal del canal a
reproducir. La figura 2 ilustra este principio con más detalle. Las
señales de los canales son proporcionadas en las salidas 14 de la
fuente. El dispositivo 20 de ocultación comprende una unidad 21 de
combinación lineal, que crea señales principales m. En otros modos
de realización, la señal principal m podría ser proporcionada desde
cualquier otro lugar. La señal principal m es proporcionada a
diversas secciones 40 de filtrado de canales, en las cuales la
ocultación de una señal de canal errónea puede ser efectuada de
acuerdo con la presente invención. Las señales principales
proporcionadas a las distintas secciones 40 de filtrado de canales
podrían ser las mismas señales principales o señales diferentes.
Las señales de canal no erróneas ni ocultas son proporcionadas a
las entradas 34 de destino.
Las secciones 40 de filtrado de canales están
basadas en filtros paramétricos, controlados por un conjunto de
coeficientes. Estos coeficientes se obtienen adaptativamente durante
la recepción de tramas válidas de la señal de canal en cuestión y,
preferiblemente, a partir de al menos uno de los demás canales, a
través de la señal principal. Los parámetros calculados son
almacenados en una memoria de parámetros. En el caso de una pérdida
de tramas o errores de trama, que afecte al menos a partes de la
señal del canal en cuestión, se aplica el modelo paramétrico
utilizando los parámetros del modelo almacenado y la señal principal
del al menos otro canal de señal. La señal de salida resultante del
modelo paramétrico puede ser utilizada como un substituto de la
señal de canal perdida, o puede ser combinada con una señal de canal
que haya sido obtenida utilizando cualquier técnica anterior, con
el fin de generar tal substituto.
La figura 3 ilustra un modo de realización de
una de las secciones 40 de filtrado del canal, de acuerdo con la
presente invención. El dispositivo 20 de ocultación conectado a las
salidas 14 de al fuente, comprende varias secciones 40 de filtro
del canal, preferiblemente una por canal, de las cuales solamente se
ilustra una de ellas en la figura 3. La sección 40 de filtrado del
canal ilustrada está indicada en línea de puntos. La sección 40 de
filtrado del canal ilustrada afecta a la señal x1 de canal, que se
supone estar dividida en porciones de tiempo, por ejemplo, tramas.
La porción de tiempo n de la señal del canal está indicada como
x_{1}(n). Unos medios 23 de investigación de estado del
error están conectados a la señal x_{1}(n). Si la porción
de señal está libre de errores, es decir, hay presente una trama
válida, la señal del canal es reenviada a unos medios 22 de
seguimiento de la señal. La unidad 21 de combinación lineal del
dispositivo 20 de ocultación proporciona una señal principal
m_{-1}(n), que excluye la señal de canal x_{1}(n),
a unos medios 26 de filtro paramétrico de los medios 22 de
seguimiento de la señal. El filtro genera una señal
\hat{x}_{1}(n), que pretende ser una estimación de la
señal x_{1}(n) de canal. Unos medios 28 de suma generan un
señal diferencia \Deltax_{1}(n), que se proporciona a
unos medios 27 de optimización de filtrado, que optimiza los
parámetros o coeficientes del filtro paramétrico con el fin de
minimizar la señal diferencia \Deltax_{1}(n), de acuerdo
con un criterio de mínimos. Preferiblemente, la señal diferencia
\Deltax_{1}(n) se minimiza en un sentido de media
cuadrática o de media cuadrática ponderada. Los parámetros
optimizados h_{1}(n) conseguidos de esta manera son
suministrados como señal de salida desde los medios 22 de
seguimiento de la señal, y representan la correlación momentánea
entre la señal principal m_{-1}(n) y la señal
x_{1}(n) de canal. Los parámetros optimizados
h_{1}(n) son almacenados en una memoria 24 para uso
posterior.
El procedimiento de minimización puede ser
implementado alternativamente utilizando un procedimiento conocido
de minimización de errores de filtro de Wiener, resolviendo un
sistema de ecuaciones lineales, aplicando por ejemplo una recursión
de Levinson, estudiada más adelante.
La señal x_{1}(n) de canal está
conectada de una manera no modificada a través de unos medios 42 de
conmutación, a las entradas multicanal 34 de destino.
Si los medios 23 de investigación de estado de
errores concluyen que la presente porción x_{1}(n) de señal
del canal es errónea, total o parcialmente, la parte de señal del
canal no es reenviada a los medios 22 de seguimiento de la señal.
En lugar de eso, se proporciona una señal de control para que los
medios 42 de conmutación interrumpan la porción de la señal del
canal. Al mismo tiempo, la señal principal m_{-1}(n) es
suministrada a un filtro 25 de reconstrucción, que se define por
los parámetros asociados con la porción anterior
h_{1}(n-1) de la señal del canal que está
libre de errores. (El caso de más de una señal de canal errónea en
secuencia, se estudia con más detalle a continuación). Una señal
x^{\text{*}}_{1}(n) de salida desde el filtro 25 de
reconstrucción es una suposición de la señal de canal original,
ahora errónea, generada a partir de la señal principal
m_{-1}(n), utilizando la correlación momentánea anterior
entre la señal principal m_{-1}(n-1) y la
señal x_{1}(n-1) del canal. Los medios 42
de conmutación sustituyen la señal de canal entrante errónea por la
señal supuesta x^{\text{*}}_{1}(n), con el fin de ocultar
el error de la mejor manera posible.
En el caso de que sean erróneas varias partes
(tramas) sucesivas de la señal del canal, es posible aplicar
diversas soluciones. En un modo de realización, el filtro 25 de
reconstrucción utiliza el último conjunto almacenado de parámetros
asociados con una parte de la señal de canal libre de errores. Esto
significa que si ocurren dos partes erróneas sucesivas, la señal
supuesta de la segunda está basada en la correlación entre la señal
principal m_{-1}(n-2) y la señal
x_{1}(n-2) del canal para una parte de la
señal del canal que está dos partes más atrás. Cuanto más larga es
la secuencia de señales erróneas, más imprecisa se hace la
relevancia del filtro.
En otro modo de realización, la señal supuesta
x^{\text{*}}_{1}(n), regenerada para una primera señal de
canal errónea, se conecta hacia atrás a los medios 22 de
seguimiento de la señal, como se ilustra con la línea de puntos 41,
para formar la base de una nueva estimación del filtro. Una
ocultación de las sucesivas señales de canal erróneas puede estar
basada siempre en la última versión disponible del filtro,
independientemente de que la versión del filtro esté asociada con
una señal libre de errores o con una señal supuesta.
En un tercer modo de realización, puede
ocultarse una señal de canal errónea sucesiva utilizando una señal
deducida como combinación de las dos soluciones anteriores, es
decir, una combinación del último filtro libre de errores y del
último filtro basado en la señal supuesta.
En los modos de realización estudiados
anteriormente, el seguimiento de la señal por medio de la creación
de filtros paramétricos se realiza sobre cada una de las señales de
canal individuales.
En otros modos de realización, podría ser
ventajoso en lugar de eso utilizar filtros que reproduzcan
combinaciones lineales de las señales de canal. La figura 4 ilustra
tal alternativa. En este caso, se disponen cuatro secciones 40 de
filtro de canal, que son aplicadas a combinaciones lineales de las
señales de canal, creadas en respectivos combinadores lineales 44.
En el caso de cualquier señal errónea, las salidas de la señal
supuesta, desde las secciones 40 de filtro de canal, son combinadas
de nuevo linealmente en un combinador 45 de salida, con el fin de
generar las señales de sustitución de las señales de canal
erróneas.
Las señales de canal pueden ser también, ellas
mismas, combinaciones lineales de señales de canal originales. Por
ejemplo, una solución común para transmitir señales de audio estéreo
es transmitir una señal monofónica que sea la media de las dos
señales de canal, y una señal de un lado que sea la mitad de la
diferencia entre las señales originales. En tal sistema, podría muy
bien aparecer un error en la señal monofónica o en la señal de un
lado, por lo que se efectúa ventajosamente una ocultación de la
señal de canal, de acuerdo con la presente invención, por ejemplo
en la señal de un lado basada en la señal monofónica.
En un ejemplo más específico de un sistema de
transmisión de señales de audio estereofónicas, un sistema
codificador/descodificador utiliza una representación de un lado y
una señal monofónica de la señal de entrada original. La señal
monofónica está definida como:
m(n) =
\frac{x_{1}(n) +
x_{2}(n)}{2},
\vskip1.000000\baselineskip
mientras que la señal de un lado
viene dada
por:
s(n) =
\frac{x_{1}(n) +
x_{2}(n)}{2},
El modelo paramétrico aplicado para la
ocultación de errores de acuerdo con el presente modo de realización
de la invención se supone que es un filtro lineal FIR (de Respuesta
de Impulsos Finitos) de orden P con la función de
transferencia:
H(z) =
\sum\limits^{P}_{i=0} \ h(i) \cdot
z^{-1}.
La señal de entrada al modelo paramétrico es una
señal monofónica descodificada m'(n), mientras que el modelo genera
una estimación \hat{s}'(n) de la señal descodificada s'(n) de un
lado. Un procedimiento de minimización de errores calcula el vector
h de coeficientes del filtro, de forma tal que la señal
\hat{s}'(n) de salida del filtro es la que más coincide con la
señal s'(n) de un lado. Existen procedimientos conocidos de
minimización de errores que pueden ser aplicados en este caso, de
los cuales uno es la solución del filtro de Wiener.
De acuerdo con la solución de Wiener, el filtro
h válido para una trama de datos se elige de forma tal que
hace mínima la suma del error al cuadrado entre la señal s'(n) de un
lado y la salida \hat{s}'(n) del filtro, es decir, la suma de
r^{2} (n) =
[s'(n)
-\hat{s}'(n)]^{2}
donde n es el índice de las
muestras de una trama recibida. Este criterio de minimización
conduce a que se requiere que el error y la versión retardada de la
señal m' sean
ortogonales:
E[m'(n-k)\cdot
r(n)]= 0,
\hskip0.3cmdonde
\hskip0.3cmk\epsilon \ [0,...,P].
Esto conduce al siguiente sistema de ecuaciones
lineales para el vector h de coeficientes del filtro:
donde 101 es una
matriz de Toeplitz de autocorrelaciones de la señal
m':
y donde r_{mm} es un
vector de correlaciones cruzadas de señales m' y
s':
\underline{r}_{ms} = [r_{ms}(k)],
\hskip0.3cmk\epsilon \ [0,...P].
Tras el cálculo, los coeficientes del filtro son
meramente almacenados, pero no se usan más. Sin embargo, si la
trama subsiguiente es errónea, de forma tal que al menos algunas
partes de la señal s' de un lado no están disponibles, entonces se
utilizarán los coeficientes almacenados.
En una primera etapa, se obtendrá la señal
monofónica m'(n). El caso en el que también la señal monofónica
está afectada por la pérdida de tramas, se estudiará con más detalle
más adelante. En una segunda etapa, se aplicará el modelo
paramétrico con el fin de reconstruir una señal s'*(n) de
sustitución para la señal de un lado. Esto se hace fijando primero
los coeficientes del filtro con los almacenados en la memoria.
Después, se filtra la señal monofónica, que generará la señal
s'*(n).
Los pasos principales de un modo de realización
de un método de ocultación para la señal del canal, de acuerdo con
la presente invención, se presentan en un diagrama de flujo en la
figura 5A. El proceso comienza en el paso 200. En el paso 200, se
proporciona una señal de entrada, preferiblemente una señal
principal basada en un cálculo de combinación lineal de las señales
de canal recibidas. La señal principal puede ser suministrada
también como una de las señales de canal. Este es un caso especial
de la primera alternativa, donde se utiliza la "combinación
lineal" de solamente una señal de canal. La señal principal puede
ser proporcionada también desde cualquier otro lugar, por ejemplo
como resultado de otro procedimiento de ocultación. Preferiblemente,
la señal monofónica está asociada en algún sentido con las señales
de canal presentes. Estas alternativas serán estudiadas con más
detalle a continua-
ción.
ción.
En el paso 204, se investiga el estado de los
errores de la señal del canal en cuestión. En muchos sistemas
digitales, se proporciona típicamente una trama que comprende datos
de la señal con algunos bits de estado de los errores. El paso de
investigación comprenderá en tal caso la comprobación de los bits de
estado de los errores. En otros casos, donde no hay información
explícita del estado de los errores, han de emprenderse acciones
más orientadas a la detección. Por ejemplo, pueden comprobarse bits
de paridad o de redundancia. En sistemas aún más avanzados, el
contenido real de la señal podría analizarse para detectar
comportamientos "no realistas". Esto podría ser útil, por
ejemplo, en sistema de audio analógicos.
Basándose en el estado de los errores de la
señal del canal, se decide en el paso 206 si la parte o trama
presente de la señal del canal es errónea, total o parcialmente. Si
la señal de canal está libre de errores, el procedimiento continúa
en el paso 208, donde se optimiza el filtro paramétrico, por ejemplo
de acuerdo con los principios similares a los que se han descrito
anteriormente. Los parámetros optimizados son almacenados después
en el paso 210 para cualquier uso futuro.
Si la señal de canal es errónea en algún
sentido, es decir, si el contenido es defectuoso o si falta la
trama, tendrá lugar un procedimiento real de ocultación. En el paso
212 se genera una señal que va a sustituir y por tanto a ocultar la
señal errónea, filtrando la señal principal proporcionada en un
filtro definido por los parámetros procedentes de la trama o parte
de la señal libre de errores precedente. En el paso 214, la señal
generada sustituye a la parte errónea de la señal, ocultando por
ello el error de la mejor manera posible. El procedimiento se
detiene en el paso 299.
El procedimiento anterior se repite para cada
parte de la señal, que está indicado por la línea de puntos
250.
El diagrama de flujo anterior es válido también
para uno de los modos de realización cuando se tratan varias tramas
erróneas subsiguientes. Para cada trama errónea, en el paso 212, se
utilizan los parámetros del filtro asociados con la última parte de
la señal que esté libre de errores, independientemente de cuánto
tiempo atrás se recibió esa señal. En un modo de realización
ligeramente alterado, el paso 212 puede ser modificado también para
que comprenda un enmudecimiento gradual de los parámetros del
filtro, lo cual conducirá a una transferencia gradual hacia una
señal principal pura.
La figura 5B ilustra un modo de realización
alternativo. Todos los pasos que sean similares a los de la figura
5A tienen las mismas referencias numéricas y no serán estudiados con
más detalle. Si se detecta una parte de señal errónea, el
procedimiento continuará en el paso 211, en el cual se produce una
señal de ocultación. Esta señal está basada en parámetros
anteriores del filtro, de acuerdo con cualquier configuración
predeterminada.
Cuando se genera la señal de ocultación y ha
sustituido a la señal original errónea, se efectúan los pasos de
optimización del filtro y de almacenamiento de los parámetros
optimizados, pero ahora están basados en la señal de ocultación en
lugar de estarlo en la señal original libre de errores. De esa
manera, pueden utilizarse los filtros que comprenden en algún
sentido la última información posible, en las partes sucesivas
erróneas de la señal.
En algunos modos de realización, el paso 211
puede incluir también una combinación de parámetros deducidos de
las señales libres de errores y de las señales de ocultación. Tales
alternativas serán estudiadas con más detalle a continuación.
Con el fin de visualizar la utilización de la
información, la figura 7A ilustra una situación de ocultación que
tiene una sola señal errónea. Durante una trama n-1,
se generan los parámetros h_{k}(n-1) del
filtro para el canal x_{k}, basándose en la información de la
señal de las otras señales de los canales. Durante la trama n, el
canal x_{k} es erróneo y no puede ser utilizado. Sin embargo, los
canales restantes de la trama n pueden ser utilizados para generar
una señal principal m_{-k}(n). La señal principal
m_{-k}(n) y los parámetros almacenados
h_{k}(n-1) son utilizados después para
generar una suposición x^{\text{*}}_{k}(n) de una señal
original, que es utilizada para ocultar la señal errónea. De esa
manera, se utilizan las correlaciones, no solamente en la dirección
temporal, sino también en el espacio del canal, para crear la señal
supuesta x^{\text{*}}_{k}(n).
Para señales erróneas consecutivas, la situación
puede parecer la de la figura 7B, si se aplica el modo de
realización de la figura 5A. Se almacenan los parámetros del filtro
de la trama n-2. Se proporciona una señal principal
m_{-k}(n) y se aplica al filtro con los parámetros de la
trama n-2 para conseguir una señal
x^{\text{*}}_{k}(n) de sustitución. En este caso, se
utilizan las correlaciones de canales de la trama
n-2 y la trama n, junto con las correlaciones
temporales entre las tramas n-2 y n. Sin embargo, la
información de la trama n-1 se queda esencialmente
sin utilizar. Para secuencias más cortas de tramas erróneas, tal
abandono de la información podría no ser muy serio. Sin embargo, si
el número de tramas erróneas en secuencia se hace grande, podrían
ser posibles unas suposiciones más precisas si se consideran también
las tramas intermedias.
La figura 7C ilustra la situación según un
método de acuerdo con el modo de realización ilustrado en la figura
5B. Los parámetros h_{k}(n-2) del filtro
libre de errores se consiguen de la misma manera. Sin embargo, la
señal supuesta x^{\text{*}}_{k}(n) de la trama
n-1 se utiliza también es este caso para generar
otro conjunto de parámetros h^{\text{*}}_{k}(n) del filtro
que, sin embargo, no están basados en señales totalmente libres de
errores. Se puede determinar una señal supuesta
x^{\text{*}}_{k}(n) de la trama n, utilizando los
parámetros h^{\text{*}}_{k}(n) en la señal principal
m_{-k}(n). La señal supuesta x^{\text{*}}_{k}(n)
implicará entonces correlaciones de la trama n y de la trama
n-1.
Otra posibilidad es combinar información
deducida a partir de los parámetros h^{\text{*}}_{k}(n) y
h_{k}(n-2), que aumentarán aún más la base
sobre la cual está basada la ocultación.
La figura 7D ilustra un modo de realización
adicional de la invención. La situación es que para la trama n, los
componentes de la señal k del canal son erróneos y necesitan ser
ocultados de acuerdo con la invención. En la trama precedente
n-1, al menos el canal p está afectado por errores,
pero no el canal k. La trama n-2 se supone que está
totalmente libre de errores. Puede obtenerse un conjunto de
coeficientes h_{k}(n-1) del filtro para el
instante de tiempo n-1, de acuerdo con los métodos
descritos anteriormente, para los cuales se utiliza una señal
principal m_{-p} que excluye el canal erróneo p en la obtención de
los parámetros del filtro. Sin embargo, como para la trama n la
señal k del canal es errónea, puede ser aún más ventajoso utilizar
una señal principal m_{-p,-k} que excluya ambos canales p y k,
cuando se obtienen los parámetros del filtro. Utilizando un
conjunto de parámetros del filtro obtenidos de esa manera, se
llegará a una señal supuesta x^{\text{*}}_{k}(n). Sin
embargo, como este conjunto no está basado en señales totalmente
libres de errores, puede ser ventajoso utilizar una señal supuesta
x^{\text{**}}_{k}(n) para la trama n, utilizando los
parámetros h_{k}(n-2) obtenidos a partir de
la última trama n-2 totalmente libre de errores.
Una solución aún mejor es combinar ambas señales supuestas u
obtener la señal supuesta combinando ambos conjuntos de coeficientes
de filtrado h_{k}(n-2) y
h_{k}(n-1).
Para un canal dado k, es posible por tanto
calcular conjuntos de parámetros de modelos diferentes, dependiendo
de qué combinación de señales de canal es excluida de la señal
principal. Un receptor puede precalcular y almacenar para cada
canal k, todos los conjuntos de parámetros de modelos posibles
permutando todas las combinaciones posibles de exclusiones de canal
de la señal principal. Al haber calculado todos esos modelos, ser
permite que el receptor, en alguna trama subsiguiente con errores,
utilice ese conjunto específico de parámetros del modelo que
coincida con el patrón de canales erróneos y libres de errores.
Como se ha visto por lo que antecede, es posible
utilizar una combinación lineal diferente de señales de canal para
obtener los parámetros del filtro (obtención de una señal de
entrada), de la que es utilizada para generar la señal de
sustitución (generación de señal de entrada). Sin embargo, la
obtención y generación de señales de entrada son, preferiblemente,
lo más parecidas posible.
Supóngase un ejemplo en el que se pierde una
señal multicanal x_{k}(n) y necesita ser recuperada. Esto
se hace utilizando los coeficientes almacenados del modelo
obtenidos para la última trama válida. Sin embargo, si hay pérdidas
de varias tramas subsiguientes, y la trama actual perdida es la
trama perdida de orden q consecutiva, entonces los coeficientes
almacenados del modelo pertenecen a una trama con un índice de
tiempo n-q y el conjunto de coeficientes puede ser
indicado como h_{k}(n-q). En este caso,
puede ser beneficioso hacer uso de los parámetros
h_{k}(n-1) obtenidos a partir de la trama
precedente, aún cuando fuera una trama recuperada no válida. En
general, los coeficientes a utilizar para la recuperación de una
señal multicanal x_{k}(n) de canal pueden obtenerse como
combinación de todos los conjuntos de parámetros obtenidos durante
las tramas precedentes hacia atrás hasta la última trama válida (o
incluso más). Una elección adecuada es utilizar una combinación
lineal de los conjuntos de parámetros:
h_{k}(n) =
\sum\limits^{q}_{i=1} \alpha (i) \cdot
h_{k}(n-i),
donde \alpha(i) son
factores de ponderación cuya suma es igual a uno. Fijando
\alpha(n-q) igual a 1 y todos las demás
ponderaciones igual a 0, se obtiene como resultado la utilización
solamente de los parámetros de la última trama válida, mientras que
fijando \alpha(n-1) igual a 1 y todos las
demás ponderaciones igual a cero, se obtiene como resultado la
utilización solamente de los parámetros de la última trama no
válida.
En los casos de secuencias largas de tramas
perdidas, puede ser beneficioso aplicar algún enmudecimiento gradual
de parámetros del modelo, lo que da como resultado esencialmente
una atenuación gradual de la información multicanal recuperada. En
el caso de enmudecimiento total, no se recuperará ninguna señal
multicanal, lo que da como resultado una reincidencia a una
reproducción única del canal de audio monofónico.
Un ejemplo de realización de tal técnica de
enmudecimiento para el caso de que el modelo sea un filtro FIR es
atenuar gradualmente los coeficientes del filtro. El enmudecimiento
total se consigue fijando todos los coeficientes en cero.
En algunas aplicaciones, por ejemplo, utilizando
la señal monofónica como señal principal, la señal principal no
está disponible como tal, sino que ha de ser sintetizada a partir de
señales de canal individuales. Si todas las señales de canal
individuales son defectuosas, no habrá disponible ninguna señal
principal útil para la ocultación multicanal, de acuerdo con la
invención. Además, si se consigue la señal principal desde algún
otro lugar, la señal principal puede ser errónea. En tales casos,
puede emplearse cualquier técnica de ocultación convencional de la
técnica anterior para obtener una señal de sustitución de la señal
principal, antes de que se use la señal principal para la creación
de parámetros de filtro o señales de ocultación de la señal del
canal. En el caso de que haya de obtenerse la señal principal como
combinación lineal de señales de canal individuales, el
procedimiento del paso 202 de las figuras 5A y 5B podría parecerse
al de la figura 6. Entrando a partir del paso 200, en el paso 216
ha de tomarse una decisión sobre si todas las señales individuales
de canal son erróneas, y por ello no hay disponible ninguna señal
principal útil. Como en la investigación del estado de los errores
de una señal de canal particular, esta decisión puede estar basada
en los bits de estado de los errores de la trama o bien en técnicas
de detección de errores más sofisticadas. Si cualquiera de las
señales de canal está libre de errores, el procedimiento continúa en
el paso 220, en el cual se crea una combinación lineal de señales
de canal no defectuosas como señal principal, excluyendo las señales
de canal erróneas. Si todas las señales de canal son erróneas, el
procedimiento continúa en el paso 218, donde se utiliza una técnica
de ocultación de la señal principal, de acuerdo con los métodos
convencionales, para proporcionar una estimación de la señal
principal, que puede utilizarse más tarde en el procedimiento de
ocultación de la señal de canal de acuerdo con la presente
invención. A continuación se describirá un caso en el que múltiples
señales de canal son erróneas y la invención se aplica de manera
recursiva con el fin de recuperar todas las señales de canal
erróneas.
Aún cuando la presente invención sea aplicable
en sistemas que utilizan cualquier clase de esquemas de
codificación, podría haber algunas ventajas adicionales cuando se
aplica a sistemas que utilizan codificaciones basadas en filtros
paramétricos. Cuando se considera por ejemplo la figura 1C, puede
observarse que si el descodificador utiliza descodificación
paramétrica basada en una señal monofónica, esa misma señal
monofónica puede ser proporcionada también al dispositivo de
ocultación. Un error en un canal podría, por tanto, no afectar
necesariamente a la señal monofónica.
\newpage
Más aún, si el descodificador utiliza el mismo
tipo de filtro que en el dispositivo de ocultación, se pueden
obtener otras ventajas. La figura 8 ilustra un descodificador
combinado y un dispositivo 90 de ocultación, ambos basados en
técnicas de filtros paramétricos. En una primera conexión 17A, se
proporciona una señal monofónica codificada m'', y en una segunda
conexión 17B se proporcionan parámetros de filtro codificados
h''_{1}-h''_{3}. La señal monofónica es
descodificada en un descodificador 80 de señales monofónicas, de
acuerdo con cualquier técnica convencional de señales monofónicas,
obteniendo una señal monofónica descodificada m'. La señal
monofónica m' es suministrada a una unidad 86 de filtro
descodificador.
Los parámetros de filtro codificados
h''_{1}-h''_{3} son descodificados en un
descodificador 84 de parámetros. Los parámetros de filtro
descodificados h'_{1}-h'_{3} son suministrados a
una unidad 86 de filtro descodificador para definir un filtro, que
aplicado a la señal monofónica regenera combinaciones lineales
c'_{1}-c'_{3} de señales de canal. Las
combinaciones lineales c'_{1}-c'_{3} y la señal
monofónica m' son combinadas en una unidad 82 de combinación lineal
para obtener cuatro señales de canal
x'_{1}-x'_{4}.
Los parámetros de filtro descodificados
h'_{1}-h'_{3} son suministrados también a una
memoria 24 para su almacenamiento, esperando cualquier uso futuro.
Unos medios 23 de investigación del estado de los errores comprueba
si los parámetros son erróneos o no. Si se descubre un error, la
señal monofónica descodificada se proporciona adicionalmente a un
filtro 25 de reconstrucción, definido por los parámetros almacenados
del filtro. La señal generada sustituye a la señal errónea por
medio de unos medios 42 de conmutación, en analogía con los modos
de realización descritos anteriormente.
Aún cuando la presente invención está basada en
el tratamiento digital de señales de audio, la invención puede
aplicarse también a sistemas analógicos de audio. La figura 9
ilustra un esquema de bloques de un modo de realización de un
dispositivo 20 de ocultación, de acuerdo con la presente invención,
aplicado a un sistema analógico de audio. Se proporcionan dos
canales analógicos x1 y x2 a una unidad 96 de obtención de señales
monofónicas en el dispositivo 20 de ocultación. La unidad 96 de
obtención de señales monofónicas aprovecha los dos canales y
muestrea la señal combinada efectuando una representación digital de
la señal monofónica \tilde{m}. Las señales analógicas son
reenviadas a una sección 40 de filtro del canal individual, de los
cuales solamente se ilustra con detalle uno de ellos.
Hay conectado un detector 93 de errores para
detectar las características de la señal analógica. Las señales de
audio normales siguen típicamente ciertos comportamientos
estadísticos, donde los cambios en las características de la señal
son más bien lentos o siguen ciertas estadísticas de harmónicos. Un
error de una señal analógica aparece a menudo como un cambio
repentino y con una extrema falta de correlación en las
características espectrales. Hay distintas clases de detectores en
la técnica anterior para encontrar partes con errores probables en
las señales analógicas de audio. Si no se detecta ningún error en
el detector 93 de errores, la señal analógica se pasa a través de
una unidad 97 de retardo para ajustar los tiempos de una señal
analógica no modificada a los tiempos de una señal con errores
ocultos. Unos medios 42 de conmutación proporcionan la señal
analógica inalterada en la salida de la sección 40 de filtro del
canal.
Si no se detecta ningún error, la señal
analógica es transferida también a la unidad 92 de muestreo, donde
la señal analógica de audio es digitalizada y dividida en tramas de
una duración predeterminada. La versión digitalizada de la señal
\tilde{x}_{1} de canal es una analogía con la descripción
anterior utilizada para optimizar un filtro paramétrico 26. La
señal monofónica digitalizada \tilde{m} se utiliza como entrada
del filtro 26, y unos medios 27 de optimización del filtro
optimizan los parámetros, que son almacenados después en una memoria
24. Durante las condiciones libres de errores, estas son las
actuaciones completas.
Sin embargo, si el detector 93 de errores
encuentra un error en la señal analógica, los medios 42 de
conmutación son controlados para aceptar en lugar de eso una parte
analógica de ocultación. La señal monofónica digitalizada
\tilde{m} es modificada por cualquier método de la técnica
anterior para la ocultación de señales monofónicas en una unidad 95
de ocultación de señales monofónicas, si ninguna de las señales del
canal es errónea. La señal monofónica modificada es proporcionada a
un filtro 25 de reconstrucción definido por parámetros anteriores
almacenados en la memoria 24, en analogía con los principios antes
descritos. La señal digital de ocultación es llevada a un
convertidor 94 de audio digital a analógico, que convierte la señal
digital en una señal analógica, la cual es conectada por los medios
42 de conmutación para sustituir la señal errónea.
Por eso es posible utilizar también la presente
invención para la restauración de señales analógicas de audio.
Un aspecto de la presente invención es la
posibilidad de aplicar la técnica a componentes de los diferentes
canales de audio, en lugar de hacerlo solamente a los canales de
audio completos. Es posible, por ejemplo, aplicar la invención en
una o varias sub-bandas o componentes espectrales.
Un modo de realización específico es la aplicación de la invención
en una gama de frecuencias predeterminada, que comprenda
preferiblemente solamente las frecuencias por debajo de 2 kHz, y
más preferiblemente sólo los componentes espectrales por debajo de
1 kHz.
La señal de salida resultante de un dispositivo
de ocultación de acuerdo con la presente invención, puede ser
combinada con señales de ocultación obtenidas por otros métodos de
ocultación. Esto puede ser hecho, por ejemplo, a través de un
promedio o una ponderación de las señales de sustitución generadas
en distintas relaciones.
El presente método de ocultación puede ser
utilizado también de una manera recursiva con el fin de ocultar
señales erróneas de más de un canal. El método se aplica
inicialmente de forma tal que recupera una primera señal errónea de
canal basada en la señal principal disponible, excluyendo las partes
erróneas de la señal de canal. Después, subsiguientemente, se
recuperan recursivamente todas las demás señales de canal erróneas,
donde cada una de estas recursiones hace uso de la señal principal
disponible, excluyendo las partes erróneas de la señal de canal y
las señales multicanal recuperadas de la recursión anterior.
Si la señal principal está afectada por la señal
errónea, el presente método de ocultación puede ser utilizado
también de una manera recursiva para un solo canal. Se genera una
primera señal de sustitución de acuerdo con los principios de la
presente invención, basándose en una señal principal recuperada.
Esta primera señal de sustitución es utilizada después para refinar
la estimación de la verdadera señal principal, y el método de
acuerdo con los principios de la presente invención puede ser
repetido para generar una señal de sustitución refinada. Tal
procedimiento puede ser repetido hasta que el cambio entre dos
señales de sustitución sucesivas caiga por debajo de un cierto
límite. También cuando hay más de una señal de canal errónea, el
procedimiento puede repetirse cíclicamente para refinar
sucesivamente las señales de sustitución.
Los modos de realización descritos anteriormente
han de entenderse como unos pocos ejemplos ilustrativos de la
presente invención. Los expertos en la técnica comprenderán que
pueden hacerse diversas modificaciones, combinaciones y cambios a
los modos de realización, sin apartarse del alcance de la presente
invención. En particular, pueden combinarse distintas soluciones
parciales de los diferentes modos de realización para formar otras
configuraciones, donde sea técnicamente posible. Sin embargo, el
alcance de la presente invención está definido por las
reivindicaciones anexas.
US 6.490.551
DE 3638922
3 GPP TS 26.091, cláusulas 6 y 7
EP 0 637 013
Claims (28)
1. Método para recuperar componentes erróneos de
señales multicanal (x_{1} - x_{N}) de audio que utilizan
correlaciones entre canales,
caracterizado por los pasos de:
obtener y almacenar, en un procedimiento de
optimización, en condiciones libres de errores, para una señal
(x_{1} - x_{N}) de canal predeterminada, unos parámetros h_{k}
de un modelo paramétrico (27) que da una estimación de una parte de
la señal (x_{1} - x_{N}) de canal predeterminada, cuando se
aplica para obtener una señal de entrada;
detectar si al menos una parte de la señal de
canal es errónea; y
generar, cuando una parte de la señal (x_{1} -
x_{N}) de canal predeterminada es errónea, una parte de señal de
sustitución para la parte errónea de la señal (x_{1} - x_{N}) de
canal predeterminada, aplicando el modelo paramétrico (25)
basándose en los parámetros (h_{k}) almacenados, asociados con una
señal precedente libre de errores, para generar una señal de
entrada.
2. Método según la reivindicación 1,
caracterizado porque los pasos de obtención, detección y
generación son realizados para cada una de las señales (x_{1} -
x_{N}) de canal.
3. Método según la reivindicación 2,
caracterizado porque las señales de entrada, para al menos
dos de las señales (x_{1} - x_{N}) de canal, son
diferentes.
4. Método según la reivindicación 1 o 3,
caracterizado porque la parte errónea de la al menos una
señal (x_{1} - x_{N}) de canal, está ausente o no es
completamente correcta.
5. Método según cualquiera de las
reivindicaciones 1 a 4, caracterizado porque las señales de
entrada son partes correspondientes de una combinación lineal (m;
m_{-1}(n); m_{-k}(n); m') de las señales (x_{1}
- x_{N}) de canal.
6. Método según la reivindicación 5,
caracterizado porque la señal de entrada obtenida es igual a
la señal de entrada generada.
7. Método según la reivindicación 5,
caracterizado porque la combinación lineal de la señal de
entrada obtenida es igual a la combinación lineal de la señal de
entrada generada.
8. Método según la reivindicación 5 o 7,
caracterizado porque se obtiene una pluralidad de conjuntos
de parámetros h_{k} del modelo paramétrico (27) para una
pluralidad de combinaciones lineales en el paso de obtención y
almacenamiento, por lo que el paso de generación de la señal de
sustitución comprende la selección del conjunto de parámetros
h_{k} asociados con la misma combinación lineal como señal de
entrada generada disponible.
9. Método según cualquiera de las
reivindicaciones 6 a 8, caracterizado porque la combinación
lineal (m, m') es proporcional a la suma de las señales (x_{1} -
x_{N}) de canal.
10. Método según cualquiera de las
reivindicaciones 5 a 9, caracterizado por el paso adicional
de:
estimar partes erróneas de la combinación lineal
(m; m_{-1}(n); m_{-k}(n); m') de señales de canal
por ocultación temporal de errores, por lo que al menos unas partes
de las porciones estimadas de la combinación lineal se utilizan en
la combinación lineal.
11. Método según las reivindicaciones 5, 6 o 7,
caracterizado porque la combinación lineal
(m_{-1}(n); m_{-k}(n)) excluye al menos una parte
de la señal (x_{1} - x_{N}) de canal predeterminada.
12. Método según cualquiera de las
reivindicaciones 1 a 4, caracterizado porque la señal de
entrada es una señal de ruido.
13. Método según cualquiera de las
reivindicaciones 1 a 12, caracterizado por
generar partes de la señal de sustitución para
las partes erróneas subsiguientes de la señal (x_{1} - x_{N})
de canal predeterminada, aplicando el modelo paramétrico (25)
asociado, basándose en al menos los parámetros almacenados
asociados con la última señal libre de errores de la señal de
entrada.
14. Método de acuerdo con cualquiera de las
reivindicaciones 1 a 13, caracterizado por
obtener y almacenar parámetros (h_{k}) del
modelo paramétrico asociado con partes de señal de sustitución de
la señal (x_{1} - x_{N}) de canal predeterminada; y
generar partes de la señal de sustitución para
las partes erróneas subsiguientes de la señal (x_{1} - x_{N})
de canal predeterminada, aplicando el modelo paramétrico (25)
asociado, basándose en al menos los parámetros almacenados
asociados con la parte de señal de sustitución precedente de la
señal de entrada.
15. Método según cualquiera de las
reivindicaciones 1 a 14, caracterizado por el paso adicional
de:
enmudecer gradualmente los parámetros del modelo
durante partes erróneas subsiguientes de la señal de canal
predeterminada.
16. Método según cualquiera de las
reivindicaciones 1 a 15, caracterizado porque las partes de
las señales son tramas de señales digitales.
17. Método según la reivindicación 16,
caracterizado porque el paso de detección comprende la
supervisión de la información de estado de la trama.
18. Método según cualquiera de las
reivindicaciones 1 a 15, caracterizado porque las partes de
las señales son partes de señales analógicas que tienen duraciones
uniformes.
19. Método según la reivindicación 18,
caracterizado porque el paso de detección comprende el paso
de analizar las características espectrales de las señales
analógicas.
20. Método según la reivindicación 18 o 19,
caracterizado por los pasos adicionales de:
convertir señales de canal analógicas en señales
de canal digitales (\tilde{x}_{i});
donde el paso de obtener y almacenar parámetros
(h_{k}) del modelo está basado en las señales de canal digitales
(\tilde{x}_{i});
convertir las partes recuperadas de la señal
digital en partes de la señal analógica; y
sustituir las partes erróneas de la señal
analógica por las partes recuperadas de la señal analógica.
21. Método según cualquiera de las
reivindicaciones 1 a 20, caracterizado porque las partes de
la señal están limitadas a una gama de frecuencias.
22. Método según la reivindicación 21,
caracterizado porque el método se aplica a
sub-bandas de las señales multicanal.
23. Método según cualquiera de las
reivindicaciones 1 a 22, caracterizado por los pasos
adicionales de:
generar una segunda parte de la señal de
sustitución para la parte errónea, de acuerdo con un segundo método
de recuperación de señales temporales; y
combinar la primera y segunda partes de la señal
de sustitución para obtener una parte de sustitución final, que se
utiliza para sustituir la parte errónea de la señal de canal.
24. Método según cualquiera de las
reivindicaciones 1 a 23, caracterizado porque el método se
aplica recursivamente a más de una señal de canal errónea
simultáneamente.
25. Dispositivo (20) de ocultación de errores de
una señal de audio multicanal, que utiliza correlaciones entre
canales,
caracterizado por
medios (22, 24) para obtener, por un
procedimiento de optimización, y almacenar parámetros (h_{k}) de
un modelo paramétrico (27) que da una estimación de partes de las
señales (x_{1} - x_{N}) de canal predeterminadas, cuando se
aplica a una señal de entrada obtenida;
medios (23) de investigación del estado de los
errores de partes erróneas de las señales (x_{1} - x_{N}) de
canal; y
medios (25) para generar una parte de la señal
de sustitución de una parte errónea de la señal (x_{1} - x_{N})
de canal predeterminadas, conectados a los medios (22, 24) para
obtener y almacenar parámetros (h_{k}) del modelo aplicando el
modelo paramétrico asociado (25) basándose en los parámetros
(h_{k}) almacenados, asociados con una señal precedente libre de
errores, a una señal de entrada generada.
26. Sistema (1) de audio, que comprende el
dispositivo (20) de ocultación de errores de señales multicanal, de
acuerdo con la reivindicación 25.
\newpage
27. Sistema de audio, según la reivindicación
26, caracterizado porque el dispositivo de ocultación de
errores de la señal multicanal está conectado o integrado con un
receptor (16-18).
28. Sistema de audio según la reivindicación 26,
caracterizado porque el dispositivo (20) de ocultación de
errores de la señal multicanal está conectado a un sistema de
señales analógicas de audio.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0303500 | 2003-12-19 | ||
SE0303500A SE0303500D0 (sv) | 2003-12-19 | 2003-12-19 | Frame loss concealment for multi-channel audio signal transmission |
SE0400416A SE527866C2 (sv) | 2003-12-19 | 2004-02-20 | Kanalsignalmaskering i multikanalsaudiosystem |
SE0400416 | 2004-02-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2286714T3 true ES2286714T3 (es) | 2007-12-01 |
Family
ID=31996353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES04809050T Active ES2286714T3 (es) | 2003-12-19 | 2004-12-15 | Ocultacion de errores en sistemas multicanales de audio. |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1649452B1 (es) |
JP (1) | JP4723490B2 (es) |
AT (1) | ATE365364T1 (es) |
DE (1) | DE602004007142T2 (es) |
ES (1) | ES2286714T3 (es) |
PT (1) | PT1649452E (es) |
SE (1) | SE527866C2 (es) |
WO (1) | WO2005059898A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4930320B2 (ja) * | 2006-11-30 | 2012-05-16 | ソニー株式会社 | 再生方法及び装置、プログラム並びに記録媒体 |
US8359196B2 (en) | 2007-12-28 | 2013-01-22 | Panasonic Corporation | Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method |
EP2296143B1 (en) | 2008-06-27 | 2018-01-10 | III Holdings 12, LLC | Audio signal decoding device and balance adjustment method for audio signal decoding device |
ES2387869T3 (es) * | 2008-07-30 | 2012-10-03 | FRANCE TéLéCOM | Reconstrucción de datos de audio multicanal |
US8737626B2 (en) * | 2009-01-13 | 2014-05-27 | Panasonic Corporation | Audio signal decoding device and method of balance adjustment |
KR101073409B1 (ko) * | 2009-03-05 | 2011-10-17 | 주식회사 코아로직 | 디코딩 장치 및 디코딩 방법 |
CN102414745B (zh) * | 2009-05-22 | 2014-07-30 | 松下电器产业株式会社 | 编码装置、解码装置及编码、解码方法 |
WO2010137300A1 (ja) * | 2009-05-26 | 2010-12-02 | パナソニック株式会社 | 復号装置及び復号方法 |
EP2761618B1 (en) | 2011-09-29 | 2016-11-30 | Dolby International AB | High quality detection in fm stereo radio signals |
EP2709101B1 (en) | 2012-09-13 | 2015-03-18 | Nxp B.V. | Digital audio processing system and method |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3421962B2 (ja) * | 1996-10-14 | 2003-06-30 | 日本電信電話株式会社 | 欠落音響信号合成処理方法 |
DE19721487A1 (de) * | 1997-05-23 | 1998-11-26 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen |
JP3567750B2 (ja) * | 1998-08-10 | 2004-09-22 | 株式会社日立製作所 | 圧縮音声再生方法及び圧縮音声再生装置 |
EP1103953B1 (en) * | 1999-11-23 | 2006-08-16 | Texas Instruments Incorporated | Method for concealing erased speech frames |
JP2001296894A (ja) * | 2000-04-12 | 2001-10-26 | Matsushita Electric Ind Co Ltd | 音声処理装置および音声処理方法 |
DE10034783A1 (de) * | 2000-07-18 | 2002-02-07 | Bosch Gmbh Robert | Verfahren zur Fehlerverschleierung von Übertragungsfehlern in digitalen Audiodaten |
CN1705980A (zh) * | 2002-02-18 | 2005-12-07 | 皇家飞利浦电子股份有限公司 | 参数音频编码 |
WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
US20040083110A1 (en) * | 2002-10-23 | 2004-04-29 | Nokia Corporation | Packet loss recovery based on music signal classification and mixing |
-
2004
- 2004-02-20 SE SE0400416A patent/SE527866C2/sv not_active IP Right Cessation
- 2004-12-15 EP EP04809050A patent/EP1649452B1/en active Active
- 2004-12-15 ES ES04809050T patent/ES2286714T3/es active Active
- 2004-12-15 JP JP2006518595A patent/JP4723490B2/ja not_active Expired - Fee Related
- 2004-12-15 PT PT04809050T patent/PT1649452E/pt unknown
- 2004-12-15 WO PCT/SE2004/001866 patent/WO2005059898A1/en active IP Right Grant
- 2004-12-15 DE DE602004007142T patent/DE602004007142T2/de active Active
- 2004-12-15 AT AT04809050T patent/ATE365364T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE602004007142D1 (de) | 2007-08-02 |
JP2007529020A (ja) | 2007-10-18 |
WO2005059898A1 (en) | 2005-06-30 |
SE527866C2 (sv) | 2006-06-27 |
SE0400416D0 (sv) | 2004-02-20 |
EP1649452A1 (en) | 2006-04-26 |
JP4723490B2 (ja) | 2011-07-13 |
DE602004007142T2 (de) | 2008-02-14 |
SE0400416L (sv) | 2005-06-20 |
PT1649452E (pt) | 2007-08-08 |
EP1649452B1 (en) | 2007-06-20 |
ATE365364T1 (de) | 2007-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7835916B2 (en) | Channel signal concealment in multi-channel audio systems | |
ES2387943T3 (es) | Ocultación de error de transmisión en una señal de audio digital en una estructura de decodificación jerárquica | |
KR101291197B1 (ko) | 오디오 신호 복호화 방법 및 장치 | |
KR101290425B1 (ko) | 소거된 스피치 프레임을 복원하는 시스템 및 방법 | |
JP4731774B2 (ja) | 高品質オーディオ用縮尺自在符号化方法 | |
KR101265874B1 (ko) | 로버스트 디코더 | |
US7365671B1 (en) | Communication channel with undersampled interpolative timing recovery | |
KR101203244B1 (ko) | 통신 시스템에서 은닉 프레임들을 발생시키는 방법 | |
TWI413107B (zh) | 具有多重階段編碼簿及冗餘編碼之子頻帶語音編碼/解碼的方法 | |
JPH07503115A (ja) | サブバンド符号器における誤り防止保護方法 | |
ES2286714T3 (es) | Ocultacion de errores en sistemas multicanales de audio. | |
US8682680B2 (en) | Methods and apparatuses for bit stream decoding in MP3 decoder | |
ES2209383T3 (es) | Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision. | |
JP2004046179A (ja) | 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置 | |
EP2458585B1 (en) | Error concealment for sub-band coded audio signals | |
KR100263603B1 (ko) | 재기록성 기록 매체상에서 및 그로부터 디지탈 신호를 레코딩 및 재생하는 시스템 | |
KR20020002241A (ko) | 디지털 오디오장치 | |
KR20080075050A (ko) | 오류 프레임의 파라미터 갱신 방법 및 장치 | |
CN110770823B (zh) | 基于数据包的高级采样音频隐藏 | |
KR100300887B1 (ko) | 디지털 오디오 데이터의 역방향 디코딩 방법 | |
MXPA05003937A (es) | Codificacion de audio sinusoidal con actualizaciones de fases. | |
JPH08211898A (ja) | サブバンド・オーディオ信号合成装置 | |
US11121721B2 (en) | Method of error concealment, and associated device | |
KR20070091512A (ko) | 복호화된 오디오 신호의 오류 은폐 방법 및 장치 | |
MX2007015190A (es) | Descodificador voluminoso |