ES2286714T3 - Ocultacion de errores en sistemas multicanales de audio. - Google Patents

Ocultacion de errores en sistemas multicanales de audio. Download PDF

Info

Publication number
ES2286714T3
ES2286714T3 ES04809050T ES04809050T ES2286714T3 ES 2286714 T3 ES2286714 T3 ES 2286714T3 ES 04809050 T ES04809050 T ES 04809050T ES 04809050 T ES04809050 T ES 04809050T ES 2286714 T3 ES2286714 T3 ES 2286714T3
Authority
ES
Spain
Prior art keywords
signal
channel
signals
parameters
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES04809050T
Other languages
English (en)
Inventor
Stefan Bruhn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303500A external-priority patent/SE0303500D0/xx
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2286714T3 publication Critical patent/ES2286714T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Amplifiers (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Método para recuperar componentes erróneos de señales multicanal (x1 - xN) de audio que utilizan correlaciones entre canales, caracterizado por los pasos de: obtener y almacenar, en un procedimiento de optimización, en condiciones libres de errores, para una señal (x1 - xN) de canal predeterminada, unos parámetros hk de un modelo paramétrico (27) que da una estimación de una parte de la señal (x1 - xN) de canal predeterminada, cuando se aplica para obtener una señal de entrada; detectar si al menos una parte de la señal de canal es errónea; y generar, cuando una parte de la señal (x1 - xN) de canal predeterminada es errónea, una parte de señal de sustitución para la parte errónea de la señal (x1 - xN) de canal predeterminada, aplicando el modelo paramétrico (25) basándose en los parámetros (hk) almacenados, asociados con una señal precedente libre de errores, para generar una señal de entrada.

Description

Ocultación de errores en sistemas multicanales de audio.
Campo técnico
La presente invención está relacionada en general con métodos y dispositivos de sistemas de audio de múltiples canales y, en particular, con métodos y dispositivos para ocultar señales de canales erróneos.
Antecedentes
Hay un gran interés en gestionar señales de audio y, en particular, señales de audio de múltiples canales. Las señales de audio se consiguen por grabaciones directas, o por generación de sonido estereofónico, o bien como una recuperación de representaciones anteriores de señales de audio almacenadas, y transmitidas de alguna manera a una unidad final, tal como un sistema de altavoces o a un almacén de señales de audio. En los sistemas de señales digitales, las señales de audio son codificadas típicamente antes de ser transmitidas, y descodificadas en el lado del receptor.
La codificación paramétrica se ha encontrado muy atractiva, ya que la velocidad en bits para transmitir datos en múltiples canales puede reducirse significativamente en comparación con meras codificaciones de la forma de onda. Existen varios ejemplos de esquemas de codificación paramétrica en la técnica anterior.
Independientemente del método de transmisión que se utilice, los sistemas de comunicaciones están típicamente asociados con canales de transmisión propensos a errores, por ejemplo, en comunicaciones inalámbricas o a través de Internet. Existen varios niveles para combatir señales recibidas erróneamente. Directamente en la capa de transmisión, existen rutinas de manejo de errores, tales como la corrección de errores sin retorno (FEC) y los esquemas de retransmisión, que intentan compensar ciertos tipos de errores inducidos en la transmisión. Sin embargo, algunos errores no puede ser totalmente corregidos por tales esquemas de errores de la transmisión, y los descodificadores, en el caso de señales digitales, han de ser configurados para recibir también señales defectuosas o incluso asumir la pérdida de partes de la señal. Típicamente, los descodificadores recibirán datos codificados que corresponden a tramas de la señal de entrada, y existe típicamente un señalizador que indica si los datos de la trama están libres de errores o son defectuosos o se han perdido, es decir, son inutilizables. En el caso de datos inutilizables, el descodificador no podrá descodificar y reconstruir la correspondiente trama de la señal. En lugar de eso, se dispondrán medios para ocultar la pérdida de tramas y hacer que la pérdida sea tan inaudible como sea posible.
En el caso de señales de audio estereofónicas o de múltiples canales, la pérdida de tramas puede afectar específicamente la representación de audio en estéreo o en múltiples canales. Por ejemplo, si uno de los canales transmitidos está afectado, el descodificador puede seguir siendo capaz de reconstruir el otro canal o, dependiendo de la representación equivalente elegida, puede seguir siendo posible reconstruir una señal monofónica. Sin embargo, una pérdida repentina de uno de los canales de audio, así como por ejemplo el cambio brusco de una señal estéreo a una señal monofónica, perjudicará la calidad percibida del audio. Una parte importante de la ocultación de errores del códec de audio es por tanto mitigar las pérdidas de la información estereofónica o de múltiples canales.
La mayoría de los métodos de ocultación de pérdidas de la señal de la técnica anterior están directamente relacionados con el tipo de codificación utilizada durante la etapa de transmisión. Dependiendo del tipo de códec de audio, paramétrico o no paramétrico, existen varias maneras de efectuar la ocultación de errores para los códecs de audio en general, incluyendo los que son para audio estereofónico o de múltiples canales. Es común a todos ellos el hecho de realizar intentos de ocultación durante el propio proceso de descodificación o en relación directa con él.
Los códecs de audio no paramétricos repetirán típicamente o estimarán, por ejemplo por medio de valores de interpolación de la señal recibida correctamente, con el fin de generar una sustitución de los valores erróneos. Como ejemplo, la patente de Estados Unidos 6.490.551 de Wiese y otros colaboradores, muestra cómo sustituir componentes espectrales perdidos por estimaciones (por ejemplo, por interpolación) a partir de componentes correspondientes del mismo o de otro canal (estéreo) que incluyen valores muestreados en el dominio de tiempos o de frecuencias. El mérito de esta patente es que, según reivindica, mantiene la impresión estereofónica.
Otra técnica similar, particularmente para señales estéreo, está descrita en la patente DE 3638922, de acuerdo con la cual las secciones de señal perdidas de uno de los canales estéreo son sustituidas por las correspondientes secciones de la señal del otro canal.
La ocultación típica de la pérdida de tramas en los códecs paramétricos de audio implica la sustitución de un parámetro erróneo por un parámetro correspondiente anterior y recibido correctamente. Esta es una técnica temporal ampliamente utilizada en los códecs de habla, que es directamente aplicable a los códecs paramétricos de audio. Está descrito en detalle, por ejemplo, en la especificación 3GPP sobre ocultación de errores de tramas perdidas para el códec de habla AMR, 3GPP TS 26.091, cláusulas 6 y 7.
La patente EP 0 637 013, de Cluever, describe un método paramétrico de ocultación de pérdida de tramas para códecs de habla monofónicos no paramétricos. Los valores de la señal de una trama de habla recibida correctamente, son utilizados para obtener los parámetros del modelo de síntesis del habla. En caso de una pérdida de trama, la trama de habla que falta es sintetizada aplicando ese modelo y utilizando los parámetros obtenidos durante la última trama de habla válida. Tal técnica podría ser aplicada en principio para la ocultación de errores en los códecs de audio, y en el caso de múltiples canales, canal por canal.
En el artículo "Codificación de señales de indicación biaurales - Parte II: Esquemas y aplicaciones", de C. Faller y F. Baumgarte, en IEEE Transactions on Speech and Audio Processing, VOL. 11, núm. 6, páginas 520-531, se divulga la codificación de señales de indicación biaurales en contextos generales.
Sumario
Entre los métodos de ocultación estudiados anteriormente, la mayor parte de las soluciones restauran los canales transmitidos en sistemas de audio de múltiples canales, independientes entre sí, ignorando cualquier dependencia estadística entre canales. Los métodos de los documentos US 6.490.551 y DE 3638922 aprovechan explícitamente las dependencias entre canales, pero son limitados como soluciones de códecs no paramétricos. Más aún, emplean un principio de repetición o estimación de interpolación de valores de señales recibidos correctamente, con el fin de generar una sustitución de valores erróneos, que típicamente no conducen a la mejor calidad perceptiva.
Un objeto general de la presente invención es, por tanto, proporcionar métodos y dispositivos mejorados para la ocultación de pérdidas de señal del canal, permitiendo una generación más precisa de señales de sustitución de componentes de la señal ausentes o erróneos. Otro objeto de la presente invención es proporcionar métodos y dispositivos de ocultación, que son útiles junto con cualquier principio de codificación y, en particular, con sistemas de codificación paramétrica.
Los objetos anteriores se consiguen con métodos y dispositivos de acuerdo con las reivindicaciones de patente adjuntas. En términos generales, se utiliza un modelo paramétrico, que permite generar sustituciones de componentes perdidos o erróneos de un canal de audio a partir de una señal de entrada. Durante la recepción libre de errores de tramas válidas, se obtendrán y almacenarán los parámetros de ese modelo. En el caso de una perdida de trama o error de la trama, que afecte a la información de múltiples canales, la información que falta o al menos una presunción de la misma se recupera o genera aplicando el modelo que utiliza los parámetros almacenados. La aplicación del modelo puede implicar el filtrado de los componentes de la señal de entrada de al menos otro canal de audio, o de alguna otra señal no relacionada necesariamente con ninguna señal de audio. En el caso de que se pierdan o sean erróneas varias tramas posteriores, es posible utilizar los parámetros obtenidos durante la última trama válida o utilizar parámetros obtenidos a partir de la información multicanal recuperada de la respectiva trama no válida anterior. También es posible combinar ambas técnicas, es decir, utilizar parámetros que han sido obtenidos como combinación de parámetros almacenados de la trama válida anterior con parámetros obtenidos a partir de la información multicanal recuperada de la trama anterior no válida. Más aún, si hay secuencias largas de tramas perdidas, puede ser beneficioso aplicar cierto enmudecimiento gradual de los parámetros del modelo, que esencialmente dan como resultado un enmudecimiento gradual de los parámetros del modelo, lo cual da como resultado esencialmente una atenuación gradual de la información multicanal recuperada. En el caso de un enmudecimiento completo, no se recuperará ninguna señal multicanal, lo cual da como resultado una reincidencia de la reproducción única del canal principal o monofónico de audio.
En el caso de pérdida no solamente de información multicanal, sino también de información de la señal de entrada, se aplica primero una técnica de ocultación temporal de errores propia del estado de la técnica, para recuperar la señal de entrada a partir de la información de la señal de entrada recibida en un instante de tiempo anterior. Después, en una segunda etapa, la ocultación de errores de acuerdo con la invención es aplicada para generar una presunción de la información multicanal original, a partir de la señal de entrada recuperada.
Más en general, la recuperación de información multicanal de acuerdo con la invención puede ser combinada con técnicas tradicionales de ocultación temporal de errores, que recuperan información perdida de los mismos canales respectivos basada en información recibida para estos canales en un instante de tiempo anterior.
Una ventaja de la presente invención es que las pérdidas de información multicanal pueden ser mitigadas de una forma mejorada, ya que las correlaciones entre canales son utilizadas para recuperar las señales originales de los canales. Más aún, la invención es aplicable muy en general y puede ser utilizada, por ejemplo, en sistemas de transmisión de señales de audio de múltiples canales, utilizando cualquier tipo de técnica de codificación, o en sistemas que ni siquiera utilizan codificación de señales.
Breve descripción de los dibujos
La invención, junto con ventajas y objetos adicionales de la misma, puede comprenderse mejor haciendo referencia a la descripción siguiente, tomada conjuntamente con los dibujos que se acompañan, en los cuales:
Las figuras 1A-C son diagramas de bloques esquemáticos de modos de realización de sistemas de audio, se acuerdo con la presente invención;
La figura 2 es un esquema de bloques de un modo de realización de un dispositivo de ocultación, de acuerdo con la presente invención;
La figura 3 es un esquema de bloques de un modo de realización de una sección de filtrado de canales, de acuerdo con la presente invención;
La figura 4 es un esquema de bloques de otro modo de realización de un dispositivo de ocultación, de acuerdo con la presente invención;
Las figuras 5A-5B son diagramas de flujo de las principales etapas de modos de realización de un método, de acuerdo con la presente invención;
La figura 6 es un diagrama de flujo parcial que ilustra una etapa de modos de realización de acuerdo con los diagramas de las figuras 5A-B con más detalle;
Las figuras 7A-D son diagramas que ilustran las correlaciones de datos de acuerdo con modos de realización de la presente invención;
La figura 8 es un diagrama de bloques que ilustra una implementación de un modo de realización de un dispositivo de ocultación, de acuerdo con la presente invención, integrado en un descodificador de filtro paramétrico; y
La figura 9 es un diagrama de bloques de un modo de realización de un sistema de audio analógico, de acuerdo con la presente invención.
Descripción detallada
En la presente divulgación, el término "multi-canal" se utiliza para caracterizar más de un canal. Por ejemplo, los sistemas de canales estereofónicos están incluidos en el término de sistemas "multi-canal". Una definición alternativa es un sistema de n canales, donde n \geq 2.
Más aún, el término "señal errónea" comprende toda clase de errores, incluyendo también la ausencia o pérdida de señal.
Un lugar típico para un dispositivo de ocultación es dentro o en la proximidad de un receptor o descodificador. Sin embargo, la presente invención es debida a sus partes características aplicables de forma más general, y puede ser aplicada a casi cualquier lugar de los sistemas multicanales de audio. Para ilustrar esto, la presente descripción detallada comienza con unos cuantos ejemplos de sistemas, en los cuales la presente invención es aplicable ventajosamente.
La figura 1A ilustra un modo de realización de un sistema 1 de audio que está basado en señales digitales. Una fuente 10 de señales multicanal recupera señales almacenadas desde un almacenamiento 12 de señales de audio, que en este modo de realización es un CD de señales codificadas digitalmente que representan señales de audio. Las señales de audio multicanal son transmitidas a través de las salidas 14 de la fuente. En un sistema alternativo, las señales multicanal de audio podrían ser proporcionadas también en tiempo real, como se indica con las líneas de puntos, y un sistema de micrófonos 11.
En el proceso de proporcionar las señales de audio, pueden ocurrir errores. El contenido de señal del disco 12 de CD podría estar deteriorado y ser difícil o imposible de interpretar. El procedimiento de recuperación podría producir también algunos errores de bits, dando total o parcialmente señales de canal defectuosas. Un dispositivo 20 de ocultación de acuerdo con la presente invención, podría ser por ello ser conectado ventajosamente a las salidas 14 de la fuente. Las señales multicanal "reparadas" son transmitidas después a las entradas 34 de destino, que en este modo de realización están conectadas a un respectivo altavoz 30.
La figura 1B ilustra otro modo de realización de un sistema 1 de audio, que en este caso está basada en una fuente estéreo 10 de un tipo analógico. Un disco 12 de vinilo comprende señales de audio codificadas como ondulaciones geométricas en pistas del disco 10 de vinilo. Las señales de audio de canales estéreo son suministradas, a través de las salidas 14 de la fuente, a una unidad 13 de muestreo, la cual muestrea el sonido analógico y lo representa digitalmente. En otras palabras, la unidad 13 de muestreo funciona como un convertidor analógico a digital para las señales de audio.
También en este proceso de proporcionar señales de audio hay fuentes de errores. El contenido de la señal del disco 12 de vinilo podría ser mecánicamente alterado, por ejemplo, por partículas o rascaduras. El procedimiento de recuperación podría producir errores también que influencien significativamente la calidad perceptiva. Finalmente, la conversión de analógico a digital puede también dar lugar a señales de canal total o parcialmente defectuosas. Un dispositivo 20 de ocultación, de acuerdo con la presente invención, podría por eso ser ventajosamente conectado a las salidas 14 de la fuente. Las señales multicanal "reparadas" son transmitidas después nuevamente a entradas 34 de destino estéreo, que en este modo de realización están conectadas a dos altavoces 30.
La figura 1C ilustra otro modo de realización de un sistema 1 de audio. En este caso, se descargan algunas señales de audio multicanal desde una fuente 10 de señales de audio multicanal, que en este caso es un proveedor de piezas de música. Las señales multicanal son recuperadas de la fuente 10 y proporcionadas por una conexión multicanal 4 a un codificador 5. El codificador 5 convierte las señales multicanal en una cadena de datos comunes transmitidos a través de una conexión 6 a una unidad 7 transmisora de radio. Puede utilizarse cualquier tipo de principios de codificación. La unidad 7 transmisora de radio prepara la cadena de datos comunes para ser transmitida como señales 9 de radio desde una antena emisora 8, a una antena receptora 15. Una unidad 16 receptora de radio recibe las señales y proporciona una versión tan correcta como sea posible de los datos comunes originales, a través de una conexión 17 a un descodificador 18. El descodificador 18 convierte la cadena de datos comunes de la conexión 17 en diversas señales de canal, proporcionadas en las salidas 14 de la fuente.
La parte de radio de este sistema es probablemente el origen principal de los errores de las señales de audio. Tanto el receptor 16 de radio como el descodificador 18 comprenden típicamente funcionalidades de manejo de errores más o menos complicadas o dispositivos de ocultación. Sin embargo, un dispositivo 20 de ocultación de acuerdo con la presente invención podría ser ventajoso si se conectase a las salidas 14 de la fuente. Las señales multicanal "reparadas" son transmitidas después nuevamente a las entradas 34 multicanal de destino, que en este modo de realización están conectadas a un almacén 31 de señales de audio.
Las señales de audio transmitidas a través de Internet están expuestas a menudo a errores de la transmisión. Se aplica por tanto ventajosamente un dispositivo 20 de ocultación correspondiente, sobre el lado de recepción de un sistema de transmisión de audio basado en Internet.
El principio básico de la invención es que la señal de un canal de un conjunto de señales multicanal, puede ser reproducida con bastante precisión aplicando una filtro paramétrico a una señal de entrada. La señal de entrada puede ser cualquier señal, por ejemplo una señal de ruido. Sin embargo, en modos de realización preferidos, la señal de entrada depende de una combinación lineal de al menos una de las demás señales multicanal, que da como resultado una señal "principal". La señal principal puede ser una señal monofónica, es decir, una señal que representa las señales de audio si fueran grabadas solamente por una fuente (micrófono). Sin embargo, otros modos de realización utilizan una señal principal que excluye la señal del canal a reproducir. La figura 2 ilustra este principio con más detalle. Las señales de los canales son proporcionadas en las salidas 14 de la fuente. El dispositivo 20 de ocultación comprende una unidad 21 de combinación lineal, que crea señales principales m. En otros modos de realización, la señal principal m podría ser proporcionada desde cualquier otro lugar. La señal principal m es proporcionada a diversas secciones 40 de filtrado de canales, en las cuales la ocultación de una señal de canal errónea puede ser efectuada de acuerdo con la presente invención. Las señales principales proporcionadas a las distintas secciones 40 de filtrado de canales podrían ser las mismas señales principales o señales diferentes. Las señales de canal no erróneas ni ocultas son proporcionadas a las entradas 34 de destino.
Las secciones 40 de filtrado de canales están basadas en filtros paramétricos, controlados por un conjunto de coeficientes. Estos coeficientes se obtienen adaptativamente durante la recepción de tramas válidas de la señal de canal en cuestión y, preferiblemente, a partir de al menos uno de los demás canales, a través de la señal principal. Los parámetros calculados son almacenados en una memoria de parámetros. En el caso de una pérdida de tramas o errores de trama, que afecte al menos a partes de la señal del canal en cuestión, se aplica el modelo paramétrico utilizando los parámetros del modelo almacenado y la señal principal del al menos otro canal de señal. La señal de salida resultante del modelo paramétrico puede ser utilizada como un substituto de la señal de canal perdida, o puede ser combinada con una señal de canal que haya sido obtenida utilizando cualquier técnica anterior, con el fin de generar tal substituto.
La figura 3 ilustra un modo de realización de una de las secciones 40 de filtrado del canal, de acuerdo con la presente invención. El dispositivo 20 de ocultación conectado a las salidas 14 de al fuente, comprende varias secciones 40 de filtro del canal, preferiblemente una por canal, de las cuales solamente se ilustra una de ellas en la figura 3. La sección 40 de filtrado del canal ilustrada está indicada en línea de puntos. La sección 40 de filtrado del canal ilustrada afecta a la señal x1 de canal, que se supone estar dividida en porciones de tiempo, por ejemplo, tramas. La porción de tiempo n de la señal del canal está indicada como x_{1}(n). Unos medios 23 de investigación de estado del error están conectados a la señal x_{1}(n). Si la porción de señal está libre de errores, es decir, hay presente una trama válida, la señal del canal es reenviada a unos medios 22 de seguimiento de la señal. La unidad 21 de combinación lineal del dispositivo 20 de ocultación proporciona una señal principal m_{-1}(n), que excluye la señal de canal x_{1}(n), a unos medios 26 de filtro paramétrico de los medios 22 de seguimiento de la señal. El filtro genera una señal \hat{x}_{1}(n), que pretende ser una estimación de la señal x_{1}(n) de canal. Unos medios 28 de suma generan un señal diferencia \Deltax_{1}(n), que se proporciona a unos medios 27 de optimización de filtrado, que optimiza los parámetros o coeficientes del filtro paramétrico con el fin de minimizar la señal diferencia \Deltax_{1}(n), de acuerdo con un criterio de mínimos. Preferiblemente, la señal diferencia \Deltax_{1}(n) se minimiza en un sentido de media cuadrática o de media cuadrática ponderada. Los parámetros optimizados h_{1}(n) conseguidos de esta manera son suministrados como señal de salida desde los medios 22 de seguimiento de la señal, y representan la correlación momentánea entre la señal principal m_{-1}(n) y la señal x_{1}(n) de canal. Los parámetros optimizados h_{1}(n) son almacenados en una memoria 24 para uso posterior.
El procedimiento de minimización puede ser implementado alternativamente utilizando un procedimiento conocido de minimización de errores de filtro de Wiener, resolviendo un sistema de ecuaciones lineales, aplicando por ejemplo una recursión de Levinson, estudiada más adelante.
La señal x_{1}(n) de canal está conectada de una manera no modificada a través de unos medios 42 de conmutación, a las entradas multicanal 34 de destino.
Si los medios 23 de investigación de estado de errores concluyen que la presente porción x_{1}(n) de señal del canal es errónea, total o parcialmente, la parte de señal del canal no es reenviada a los medios 22 de seguimiento de la señal. En lugar de eso, se proporciona una señal de control para que los medios 42 de conmutación interrumpan la porción de la señal del canal. Al mismo tiempo, la señal principal m_{-1}(n) es suministrada a un filtro 25 de reconstrucción, que se define por los parámetros asociados con la porción anterior h_{1}(n-1) de la señal del canal que está libre de errores. (El caso de más de una señal de canal errónea en secuencia, se estudia con más detalle a continuación). Una señal x^{\text{*}}_{1}(n) de salida desde el filtro 25 de reconstrucción es una suposición de la señal de canal original, ahora errónea, generada a partir de la señal principal m_{-1}(n), utilizando la correlación momentánea anterior entre la señal principal m_{-1}(n-1) y la señal x_{1}(n-1) del canal. Los medios 42 de conmutación sustituyen la señal de canal entrante errónea por la señal supuesta x^{\text{*}}_{1}(n), con el fin de ocultar el error de la mejor manera posible.
En el caso de que sean erróneas varias partes (tramas) sucesivas de la señal del canal, es posible aplicar diversas soluciones. En un modo de realización, el filtro 25 de reconstrucción utiliza el último conjunto almacenado de parámetros asociados con una parte de la señal de canal libre de errores. Esto significa que si ocurren dos partes erróneas sucesivas, la señal supuesta de la segunda está basada en la correlación entre la señal principal m_{-1}(n-2) y la señal x_{1}(n-2) del canal para una parte de la señal del canal que está dos partes más atrás. Cuanto más larga es la secuencia de señales erróneas, más imprecisa se hace la relevancia del filtro.
En otro modo de realización, la señal supuesta x^{\text{*}}_{1}(n), regenerada para una primera señal de canal errónea, se conecta hacia atrás a los medios 22 de seguimiento de la señal, como se ilustra con la línea de puntos 41, para formar la base de una nueva estimación del filtro. Una ocultación de las sucesivas señales de canal erróneas puede estar basada siempre en la última versión disponible del filtro, independientemente de que la versión del filtro esté asociada con una señal libre de errores o con una señal supuesta.
En un tercer modo de realización, puede ocultarse una señal de canal errónea sucesiva utilizando una señal deducida como combinación de las dos soluciones anteriores, es decir, una combinación del último filtro libre de errores y del último filtro basado en la señal supuesta.
En los modos de realización estudiados anteriormente, el seguimiento de la señal por medio de la creación de filtros paramétricos se realiza sobre cada una de las señales de canal individuales.
En otros modos de realización, podría ser ventajoso en lugar de eso utilizar filtros que reproduzcan combinaciones lineales de las señales de canal. La figura 4 ilustra tal alternativa. En este caso, se disponen cuatro secciones 40 de filtro de canal, que son aplicadas a combinaciones lineales de las señales de canal, creadas en respectivos combinadores lineales 44. En el caso de cualquier señal errónea, las salidas de la señal supuesta, desde las secciones 40 de filtro de canal, son combinadas de nuevo linealmente en un combinador 45 de salida, con el fin de generar las señales de sustitución de las señales de canal erróneas.
Las señales de canal pueden ser también, ellas mismas, combinaciones lineales de señales de canal originales. Por ejemplo, una solución común para transmitir señales de audio estéreo es transmitir una señal monofónica que sea la media de las dos señales de canal, y una señal de un lado que sea la mitad de la diferencia entre las señales originales. En tal sistema, podría muy bien aparecer un error en la señal monofónica o en la señal de un lado, por lo que se efectúa ventajosamente una ocultación de la señal de canal, de acuerdo con la presente invención, por ejemplo en la señal de un lado basada en la señal monofónica.
En un ejemplo más específico de un sistema de transmisión de señales de audio estereofónicas, un sistema codificador/descodificador utiliza una representación de un lado y una señal monofónica de la señal de entrada original. La señal monofónica está definida como:
m(n) = \frac{x_{1}(n) + x_{2}(n)}{2},
\vskip1.000000\baselineskip
mientras que la señal de un lado viene dada por:
s(n) = \frac{x_{1}(n) + x_{2}(n)}{2},
El modelo paramétrico aplicado para la ocultación de errores de acuerdo con el presente modo de realización de la invención se supone que es un filtro lineal FIR (de Respuesta de Impulsos Finitos) de orden P con la función de transferencia:
H(z) = \sum\limits^{P}_{i=0} \ h(i) \cdot z^{-1}.
La señal de entrada al modelo paramétrico es una señal monofónica descodificada m'(n), mientras que el modelo genera una estimación \hat{s}'(n) de la señal descodificada s'(n) de un lado. Un procedimiento de minimización de errores calcula el vector h de coeficientes del filtro, de forma tal que la señal \hat{s}'(n) de salida del filtro es la que más coincide con la señal s'(n) de un lado. Existen procedimientos conocidos de minimización de errores que pueden ser aplicados en este caso, de los cuales uno es la solución del filtro de Wiener.
De acuerdo con la solución de Wiener, el filtro h válido para una trama de datos se elige de forma tal que hace mínima la suma del error al cuadrado entre la señal s'(n) de un lado y la salida \hat{s}'(n) del filtro, es decir, la suma de
r^{2} (n) = [s'(n) -\hat{s}'(n)]^{2}
donde n es el índice de las muestras de una trama recibida. Este criterio de minimización conduce a que se requiere que el error y la versión retardada de la señal m' sean ortogonales:
E[m'(n-k)\cdot r(n)]= 0,
\hskip0.3cm
donde
\hskip0.3cm
k\epsilon \ [0,...,P].
Esto conduce al siguiente sistema de ecuaciones lineales para el vector h de coeficientes del filtro:
100
donde 101 es una matriz de Toeplitz de autocorrelaciones de la señal m':
102
y donde r_{mm} es un vector de correlaciones cruzadas de señales m' y s':
\underline{r}_{ms} = [r_{ms}(k)],
\hskip0.3cm
k\epsilon \ [0,...P].
Tras el cálculo, los coeficientes del filtro son meramente almacenados, pero no se usan más. Sin embargo, si la trama subsiguiente es errónea, de forma tal que al menos algunas partes de la señal s' de un lado no están disponibles, entonces se utilizarán los coeficientes almacenados.
En una primera etapa, se obtendrá la señal monofónica m'(n). El caso en el que también la señal monofónica está afectada por la pérdida de tramas, se estudiará con más detalle más adelante. En una segunda etapa, se aplicará el modelo paramétrico con el fin de reconstruir una señal s'*(n) de sustitución para la señal de un lado. Esto se hace fijando primero los coeficientes del filtro con los almacenados en la memoria. Después, se filtra la señal monofónica, que generará la señal s'*(n).
Los pasos principales de un modo de realización de un método de ocultación para la señal del canal, de acuerdo con la presente invención, se presentan en un diagrama de flujo en la figura 5A. El proceso comienza en el paso 200. En el paso 200, se proporciona una señal de entrada, preferiblemente una señal principal basada en un cálculo de combinación lineal de las señales de canal recibidas. La señal principal puede ser suministrada también como una de las señales de canal. Este es un caso especial de la primera alternativa, donde se utiliza la "combinación lineal" de solamente una señal de canal. La señal principal puede ser proporcionada también desde cualquier otro lugar, por ejemplo como resultado de otro procedimiento de ocultación. Preferiblemente, la señal monofónica está asociada en algún sentido con las señales de canal presentes. Estas alternativas serán estudiadas con más detalle a continua-
ción.
En el paso 204, se investiga el estado de los errores de la señal del canal en cuestión. En muchos sistemas digitales, se proporciona típicamente una trama que comprende datos de la señal con algunos bits de estado de los errores. El paso de investigación comprenderá en tal caso la comprobación de los bits de estado de los errores. En otros casos, donde no hay información explícita del estado de los errores, han de emprenderse acciones más orientadas a la detección. Por ejemplo, pueden comprobarse bits de paridad o de redundancia. En sistemas aún más avanzados, el contenido real de la señal podría analizarse para detectar comportamientos "no realistas". Esto podría ser útil, por ejemplo, en sistema de audio analógicos.
Basándose en el estado de los errores de la señal del canal, se decide en el paso 206 si la parte o trama presente de la señal del canal es errónea, total o parcialmente. Si la señal de canal está libre de errores, el procedimiento continúa en el paso 208, donde se optimiza el filtro paramétrico, por ejemplo de acuerdo con los principios similares a los que se han descrito anteriormente. Los parámetros optimizados son almacenados después en el paso 210 para cualquier uso futuro.
Si la señal de canal es errónea en algún sentido, es decir, si el contenido es defectuoso o si falta la trama, tendrá lugar un procedimiento real de ocultación. En el paso 212 se genera una señal que va a sustituir y por tanto a ocultar la señal errónea, filtrando la señal principal proporcionada en un filtro definido por los parámetros procedentes de la trama o parte de la señal libre de errores precedente. En el paso 214, la señal generada sustituye a la parte errónea de la señal, ocultando por ello el error de la mejor manera posible. El procedimiento se detiene en el paso 299.
El procedimiento anterior se repite para cada parte de la señal, que está indicado por la línea de puntos 250.
El diagrama de flujo anterior es válido también para uno de los modos de realización cuando se tratan varias tramas erróneas subsiguientes. Para cada trama errónea, en el paso 212, se utilizan los parámetros del filtro asociados con la última parte de la señal que esté libre de errores, independientemente de cuánto tiempo atrás se recibió esa señal. En un modo de realización ligeramente alterado, el paso 212 puede ser modificado también para que comprenda un enmudecimiento gradual de los parámetros del filtro, lo cual conducirá a una transferencia gradual hacia una señal principal pura.
La figura 5B ilustra un modo de realización alternativo. Todos los pasos que sean similares a los de la figura 5A tienen las mismas referencias numéricas y no serán estudiados con más detalle. Si se detecta una parte de señal errónea, el procedimiento continuará en el paso 211, en el cual se produce una señal de ocultación. Esta señal está basada en parámetros anteriores del filtro, de acuerdo con cualquier configuración predeterminada.
Cuando se genera la señal de ocultación y ha sustituido a la señal original errónea, se efectúan los pasos de optimización del filtro y de almacenamiento de los parámetros optimizados, pero ahora están basados en la señal de ocultación en lugar de estarlo en la señal original libre de errores. De esa manera, pueden utilizarse los filtros que comprenden en algún sentido la última información posible, en las partes sucesivas erróneas de la señal.
En algunos modos de realización, el paso 211 puede incluir también una combinación de parámetros deducidos de las señales libres de errores y de las señales de ocultación. Tales alternativas serán estudiadas con más detalle a continuación.
Con el fin de visualizar la utilización de la información, la figura 7A ilustra una situación de ocultación que tiene una sola señal errónea. Durante una trama n-1, se generan los parámetros h_{k}(n-1) del filtro para el canal x_{k}, basándose en la información de la señal de las otras señales de los canales. Durante la trama n, el canal x_{k} es erróneo y no puede ser utilizado. Sin embargo, los canales restantes de la trama n pueden ser utilizados para generar una señal principal m_{-k}(n). La señal principal m_{-k}(n) y los parámetros almacenados h_{k}(n-1) son utilizados después para generar una suposición x^{\text{*}}_{k}(n) de una señal original, que es utilizada para ocultar la señal errónea. De esa manera, se utilizan las correlaciones, no solamente en la dirección temporal, sino también en el espacio del canal, para crear la señal supuesta x^{\text{*}}_{k}(n).
Para señales erróneas consecutivas, la situación puede parecer la de la figura 7B, si se aplica el modo de realización de la figura 5A. Se almacenan los parámetros del filtro de la trama n-2. Se proporciona una señal principal m_{-k}(n) y se aplica al filtro con los parámetros de la trama n-2 para conseguir una señal x^{\text{*}}_{k}(n) de sustitución. En este caso, se utilizan las correlaciones de canales de la trama n-2 y la trama n, junto con las correlaciones temporales entre las tramas n-2 y n. Sin embargo, la información de la trama n-1 se queda esencialmente sin utilizar. Para secuencias más cortas de tramas erróneas, tal abandono de la información podría no ser muy serio. Sin embargo, si el número de tramas erróneas en secuencia se hace grande, podrían ser posibles unas suposiciones más precisas si se consideran también las tramas intermedias.
La figura 7C ilustra la situación según un método de acuerdo con el modo de realización ilustrado en la figura 5B. Los parámetros h_{k}(n-2) del filtro libre de errores se consiguen de la misma manera. Sin embargo, la señal supuesta x^{\text{*}}_{k}(n) de la trama n-1 se utiliza también es este caso para generar otro conjunto de parámetros h^{\text{*}}_{k}(n) del filtro que, sin embargo, no están basados en señales totalmente libres de errores. Se puede determinar una señal supuesta x^{\text{*}}_{k}(n) de la trama n, utilizando los parámetros h^{\text{*}}_{k}(n) en la señal principal m_{-k}(n). La señal supuesta x^{\text{*}}_{k}(n) implicará entonces correlaciones de la trama n y de la trama n-1.
Otra posibilidad es combinar información deducida a partir de los parámetros h^{\text{*}}_{k}(n) y h_{k}(n-2), que aumentarán aún más la base sobre la cual está basada la ocultación.
La figura 7D ilustra un modo de realización adicional de la invención. La situación es que para la trama n, los componentes de la señal k del canal son erróneos y necesitan ser ocultados de acuerdo con la invención. En la trama precedente n-1, al menos el canal p está afectado por errores, pero no el canal k. La trama n-2 se supone que está totalmente libre de errores. Puede obtenerse un conjunto de coeficientes h_{k}(n-1) del filtro para el instante de tiempo n-1, de acuerdo con los métodos descritos anteriormente, para los cuales se utiliza una señal principal m_{-p} que excluye el canal erróneo p en la obtención de los parámetros del filtro. Sin embargo, como para la trama n la señal k del canal es errónea, puede ser aún más ventajoso utilizar una señal principal m_{-p,-k} que excluya ambos canales p y k, cuando se obtienen los parámetros del filtro. Utilizando un conjunto de parámetros del filtro obtenidos de esa manera, se llegará a una señal supuesta x^{\text{*}}_{k}(n). Sin embargo, como este conjunto no está basado en señales totalmente libres de errores, puede ser ventajoso utilizar una señal supuesta x^{\text{**}}_{k}(n) para la trama n, utilizando los parámetros h_{k}(n-2) obtenidos a partir de la última trama n-2 totalmente libre de errores. Una solución aún mejor es combinar ambas señales supuestas u obtener la señal supuesta combinando ambos conjuntos de coeficientes de filtrado h_{k}(n-2) y h_{k}(n-1).
Para un canal dado k, es posible por tanto calcular conjuntos de parámetros de modelos diferentes, dependiendo de qué combinación de señales de canal es excluida de la señal principal. Un receptor puede precalcular y almacenar para cada canal k, todos los conjuntos de parámetros de modelos posibles permutando todas las combinaciones posibles de exclusiones de canal de la señal principal. Al haber calculado todos esos modelos, ser permite que el receptor, en alguna trama subsiguiente con errores, utilice ese conjunto específico de parámetros del modelo que coincida con el patrón de canales erróneos y libres de errores.
Como se ha visto por lo que antecede, es posible utilizar una combinación lineal diferente de señales de canal para obtener los parámetros del filtro (obtención de una señal de entrada), de la que es utilizada para generar la señal de sustitución (generación de señal de entrada). Sin embargo, la obtención y generación de señales de entrada son, preferiblemente, lo más parecidas posible.
Supóngase un ejemplo en el que se pierde una señal multicanal x_{k}(n) y necesita ser recuperada. Esto se hace utilizando los coeficientes almacenados del modelo obtenidos para la última trama válida. Sin embargo, si hay pérdidas de varias tramas subsiguientes, y la trama actual perdida es la trama perdida de orden q consecutiva, entonces los coeficientes almacenados del modelo pertenecen a una trama con un índice de tiempo n-q y el conjunto de coeficientes puede ser indicado como h_{k}(n-q). En este caso, puede ser beneficioso hacer uso de los parámetros h_{k}(n-1) obtenidos a partir de la trama precedente, aún cuando fuera una trama recuperada no válida. En general, los coeficientes a utilizar para la recuperación de una señal multicanal x_{k}(n) de canal pueden obtenerse como combinación de todos los conjuntos de parámetros obtenidos durante las tramas precedentes hacia atrás hasta la última trama válida (o incluso más). Una elección adecuada es utilizar una combinación lineal de los conjuntos de parámetros:
h_{k}(n) = \sum\limits^{q}_{i=1} \alpha (i) \cdot h_{k}(n-i),
donde \alpha(i) son factores de ponderación cuya suma es igual a uno. Fijando \alpha(n-q) igual a 1 y todos las demás ponderaciones igual a 0, se obtiene como resultado la utilización solamente de los parámetros de la última trama válida, mientras que fijando \alpha(n-1) igual a 1 y todos las demás ponderaciones igual a cero, se obtiene como resultado la utilización solamente de los parámetros de la última trama no válida.
En los casos de secuencias largas de tramas perdidas, puede ser beneficioso aplicar algún enmudecimiento gradual de parámetros del modelo, lo que da como resultado esencialmente una atenuación gradual de la información multicanal recuperada. En el caso de enmudecimiento total, no se recuperará ninguna señal multicanal, lo que da como resultado una reincidencia a una reproducción única del canal de audio monofónico.
Un ejemplo de realización de tal técnica de enmudecimiento para el caso de que el modelo sea un filtro FIR es atenuar gradualmente los coeficientes del filtro. El enmudecimiento total se consigue fijando todos los coeficientes en cero.
En algunas aplicaciones, por ejemplo, utilizando la señal monofónica como señal principal, la señal principal no está disponible como tal, sino que ha de ser sintetizada a partir de señales de canal individuales. Si todas las señales de canal individuales son defectuosas, no habrá disponible ninguna señal principal útil para la ocultación multicanal, de acuerdo con la invención. Además, si se consigue la señal principal desde algún otro lugar, la señal principal puede ser errónea. En tales casos, puede emplearse cualquier técnica de ocultación convencional de la técnica anterior para obtener una señal de sustitución de la señal principal, antes de que se use la señal principal para la creación de parámetros de filtro o señales de ocultación de la señal del canal. En el caso de que haya de obtenerse la señal principal como combinación lineal de señales de canal individuales, el procedimiento del paso 202 de las figuras 5A y 5B podría parecerse al de la figura 6. Entrando a partir del paso 200, en el paso 216 ha de tomarse una decisión sobre si todas las señales individuales de canal son erróneas, y por ello no hay disponible ninguna señal principal útil. Como en la investigación del estado de los errores de una señal de canal particular, esta decisión puede estar basada en los bits de estado de los errores de la trama o bien en técnicas de detección de errores más sofisticadas. Si cualquiera de las señales de canal está libre de errores, el procedimiento continúa en el paso 220, en el cual se crea una combinación lineal de señales de canal no defectuosas como señal principal, excluyendo las señales de canal erróneas. Si todas las señales de canal son erróneas, el procedimiento continúa en el paso 218, donde se utiliza una técnica de ocultación de la señal principal, de acuerdo con los métodos convencionales, para proporcionar una estimación de la señal principal, que puede utilizarse más tarde en el procedimiento de ocultación de la señal de canal de acuerdo con la presente invención. A continuación se describirá un caso en el que múltiples señales de canal son erróneas y la invención se aplica de manera recursiva con el fin de recuperar todas las señales de canal erróneas.
Aún cuando la presente invención sea aplicable en sistemas que utilizan cualquier clase de esquemas de codificación, podría haber algunas ventajas adicionales cuando se aplica a sistemas que utilizan codificaciones basadas en filtros paramétricos. Cuando se considera por ejemplo la figura 1C, puede observarse que si el descodificador utiliza descodificación paramétrica basada en una señal monofónica, esa misma señal monofónica puede ser proporcionada también al dispositivo de ocultación. Un error en un canal podría, por tanto, no afectar necesariamente a la señal monofónica.
\newpage
Más aún, si el descodificador utiliza el mismo tipo de filtro que en el dispositivo de ocultación, se pueden obtener otras ventajas. La figura 8 ilustra un descodificador combinado y un dispositivo 90 de ocultación, ambos basados en técnicas de filtros paramétricos. En una primera conexión 17A, se proporciona una señal monofónica codificada m'', y en una segunda conexión 17B se proporcionan parámetros de filtro codificados h''_{1}-h''_{3}. La señal monofónica es descodificada en un descodificador 80 de señales monofónicas, de acuerdo con cualquier técnica convencional de señales monofónicas, obteniendo una señal monofónica descodificada m'. La señal monofónica m' es suministrada a una unidad 86 de filtro descodificador.
Los parámetros de filtro codificados h''_{1}-h''_{3} son descodificados en un descodificador 84 de parámetros. Los parámetros de filtro descodificados h'_{1}-h'_{3} son suministrados a una unidad 86 de filtro descodificador para definir un filtro, que aplicado a la señal monofónica regenera combinaciones lineales c'_{1}-c'_{3} de señales de canal. Las combinaciones lineales c'_{1}-c'_{3} y la señal monofónica m' son combinadas en una unidad 82 de combinación lineal para obtener cuatro señales de canal x'_{1}-x'_{4}.
Los parámetros de filtro descodificados h'_{1}-h'_{3} son suministrados también a una memoria 24 para su almacenamiento, esperando cualquier uso futuro. Unos medios 23 de investigación del estado de los errores comprueba si los parámetros son erróneos o no. Si se descubre un error, la señal monofónica descodificada se proporciona adicionalmente a un filtro 25 de reconstrucción, definido por los parámetros almacenados del filtro. La señal generada sustituye a la señal errónea por medio de unos medios 42 de conmutación, en analogía con los modos de realización descritos anteriormente.
Aún cuando la presente invención está basada en el tratamiento digital de señales de audio, la invención puede aplicarse también a sistemas analógicos de audio. La figura 9 ilustra un esquema de bloques de un modo de realización de un dispositivo 20 de ocultación, de acuerdo con la presente invención, aplicado a un sistema analógico de audio. Se proporcionan dos canales analógicos x1 y x2 a una unidad 96 de obtención de señales monofónicas en el dispositivo 20 de ocultación. La unidad 96 de obtención de señales monofónicas aprovecha los dos canales y muestrea la señal combinada efectuando una representación digital de la señal monofónica \tilde{m}. Las señales analógicas son reenviadas a una sección 40 de filtro del canal individual, de los cuales solamente se ilustra con detalle uno de ellos.
Hay conectado un detector 93 de errores para detectar las características de la señal analógica. Las señales de audio normales siguen típicamente ciertos comportamientos estadísticos, donde los cambios en las características de la señal son más bien lentos o siguen ciertas estadísticas de harmónicos. Un error de una señal analógica aparece a menudo como un cambio repentino y con una extrema falta de correlación en las características espectrales. Hay distintas clases de detectores en la técnica anterior para encontrar partes con errores probables en las señales analógicas de audio. Si no se detecta ningún error en el detector 93 de errores, la señal analógica se pasa a través de una unidad 97 de retardo para ajustar los tiempos de una señal analógica no modificada a los tiempos de una señal con errores ocultos. Unos medios 42 de conmutación proporcionan la señal analógica inalterada en la salida de la sección 40 de filtro del canal.
Si no se detecta ningún error, la señal analógica es transferida también a la unidad 92 de muestreo, donde la señal analógica de audio es digitalizada y dividida en tramas de una duración predeterminada. La versión digitalizada de la señal \tilde{x}_{1} de canal es una analogía con la descripción anterior utilizada para optimizar un filtro paramétrico 26. La señal monofónica digitalizada \tilde{m} se utiliza como entrada del filtro 26, y unos medios 27 de optimización del filtro optimizan los parámetros, que son almacenados después en una memoria 24. Durante las condiciones libres de errores, estas son las actuaciones completas.
Sin embargo, si el detector 93 de errores encuentra un error en la señal analógica, los medios 42 de conmutación son controlados para aceptar en lugar de eso una parte analógica de ocultación. La señal monofónica digitalizada \tilde{m} es modificada por cualquier método de la técnica anterior para la ocultación de señales monofónicas en una unidad 95 de ocultación de señales monofónicas, si ninguna de las señales del canal es errónea. La señal monofónica modificada es proporcionada a un filtro 25 de reconstrucción definido por parámetros anteriores almacenados en la memoria 24, en analogía con los principios antes descritos. La señal digital de ocultación es llevada a un convertidor 94 de audio digital a analógico, que convierte la señal digital en una señal analógica, la cual es conectada por los medios 42 de conmutación para sustituir la señal errónea.
Por eso es posible utilizar también la presente invención para la restauración de señales analógicas de audio.
Un aspecto de la presente invención es la posibilidad de aplicar la técnica a componentes de los diferentes canales de audio, en lugar de hacerlo solamente a los canales de audio completos. Es posible, por ejemplo, aplicar la invención en una o varias sub-bandas o componentes espectrales. Un modo de realización específico es la aplicación de la invención en una gama de frecuencias predeterminada, que comprenda preferiblemente solamente las frecuencias por debajo de 2 kHz, y más preferiblemente sólo los componentes espectrales por debajo de 1 kHz.
La señal de salida resultante de un dispositivo de ocultación de acuerdo con la presente invención, puede ser combinada con señales de ocultación obtenidas por otros métodos de ocultación. Esto puede ser hecho, por ejemplo, a través de un promedio o una ponderación de las señales de sustitución generadas en distintas relaciones.
El presente método de ocultación puede ser utilizado también de una manera recursiva con el fin de ocultar señales erróneas de más de un canal. El método se aplica inicialmente de forma tal que recupera una primera señal errónea de canal basada en la señal principal disponible, excluyendo las partes erróneas de la señal de canal. Después, subsiguientemente, se recuperan recursivamente todas las demás señales de canal erróneas, donde cada una de estas recursiones hace uso de la señal principal disponible, excluyendo las partes erróneas de la señal de canal y las señales multicanal recuperadas de la recursión anterior.
Si la señal principal está afectada por la señal errónea, el presente método de ocultación puede ser utilizado también de una manera recursiva para un solo canal. Se genera una primera señal de sustitución de acuerdo con los principios de la presente invención, basándose en una señal principal recuperada. Esta primera señal de sustitución es utilizada después para refinar la estimación de la verdadera señal principal, y el método de acuerdo con los principios de la presente invención puede ser repetido para generar una señal de sustitución refinada. Tal procedimiento puede ser repetido hasta que el cambio entre dos señales de sustitución sucesivas caiga por debajo de un cierto límite. También cuando hay más de una señal de canal errónea, el procedimiento puede repetirse cíclicamente para refinar sucesivamente las señales de sustitución.
Los modos de realización descritos anteriormente han de entenderse como unos pocos ejemplos ilustrativos de la presente invención. Los expertos en la técnica comprenderán que pueden hacerse diversas modificaciones, combinaciones y cambios a los modos de realización, sin apartarse del alcance de la presente invención. En particular, pueden combinarse distintas soluciones parciales de los diferentes modos de realización para formar otras configuraciones, donde sea técnicamente posible. Sin embargo, el alcance de la presente invención está definido por las reivindicaciones anexas.
Referencias
US 6.490.551
DE 3638922
3 GPP TS 26.091, cláusulas 6 y 7
EP 0 637 013

Claims (28)

1. Método para recuperar componentes erróneos de señales multicanal (x_{1} - x_{N}) de audio que utilizan correlaciones entre canales,
caracterizado por los pasos de:
obtener y almacenar, en un procedimiento de optimización, en condiciones libres de errores, para una señal (x_{1} - x_{N}) de canal predeterminada, unos parámetros h_{k} de un modelo paramétrico (27) que da una estimación de una parte de la señal (x_{1} - x_{N}) de canal predeterminada, cuando se aplica para obtener una señal de entrada;
detectar si al menos una parte de la señal de canal es errónea; y
generar, cuando una parte de la señal (x_{1} - x_{N}) de canal predeterminada es errónea, una parte de señal de sustitución para la parte errónea de la señal (x_{1} - x_{N}) de canal predeterminada, aplicando el modelo paramétrico (25) basándose en los parámetros (h_{k}) almacenados, asociados con una señal precedente libre de errores, para generar una señal de entrada.
2. Método según la reivindicación 1, caracterizado porque los pasos de obtención, detección y generación son realizados para cada una de las señales (x_{1} - x_{N}) de canal.
3. Método según la reivindicación 2, caracterizado porque las señales de entrada, para al menos dos de las señales (x_{1} - x_{N}) de canal, son diferentes.
4. Método según la reivindicación 1 o 3, caracterizado porque la parte errónea de la al menos una señal (x_{1} - x_{N}) de canal, está ausente o no es completamente correcta.
5. Método según cualquiera de las reivindicaciones 1 a 4, caracterizado porque las señales de entrada son partes correspondientes de una combinación lineal (m; m_{-1}(n); m_{-k}(n); m') de las señales (x_{1} - x_{N}) de canal.
6. Método según la reivindicación 5, caracterizado porque la señal de entrada obtenida es igual a la señal de entrada generada.
7. Método según la reivindicación 5, caracterizado porque la combinación lineal de la señal de entrada obtenida es igual a la combinación lineal de la señal de entrada generada.
8. Método según la reivindicación 5 o 7, caracterizado porque se obtiene una pluralidad de conjuntos de parámetros h_{k} del modelo paramétrico (27) para una pluralidad de combinaciones lineales en el paso de obtención y almacenamiento, por lo que el paso de generación de la señal de sustitución comprende la selección del conjunto de parámetros h_{k} asociados con la misma combinación lineal como señal de entrada generada disponible.
9. Método según cualquiera de las reivindicaciones 6 a 8, caracterizado porque la combinación lineal (m, m') es proporcional a la suma de las señales (x_{1} - x_{N}) de canal.
10. Método según cualquiera de las reivindicaciones 5 a 9, caracterizado por el paso adicional de:
estimar partes erróneas de la combinación lineal (m; m_{-1}(n); m_{-k}(n); m') de señales de canal por ocultación temporal de errores, por lo que al menos unas partes de las porciones estimadas de la combinación lineal se utilizan en la combinación lineal.
11. Método según las reivindicaciones 5, 6 o 7, caracterizado porque la combinación lineal (m_{-1}(n); m_{-k}(n)) excluye al menos una parte de la señal (x_{1} - x_{N}) de canal predeterminada.
12. Método según cualquiera de las reivindicaciones 1 a 4, caracterizado porque la señal de entrada es una señal de ruido.
13. Método según cualquiera de las reivindicaciones 1 a 12, caracterizado por
generar partes de la señal de sustitución para las partes erróneas subsiguientes de la señal (x_{1} - x_{N}) de canal predeterminada, aplicando el modelo paramétrico (25) asociado, basándose en al menos los parámetros almacenados asociados con la última señal libre de errores de la señal de entrada.
14. Método de acuerdo con cualquiera de las reivindicaciones 1 a 13, caracterizado por
obtener y almacenar parámetros (h_{k}) del modelo paramétrico asociado con partes de señal de sustitución de la señal (x_{1} - x_{N}) de canal predeterminada; y
generar partes de la señal de sustitución para las partes erróneas subsiguientes de la señal (x_{1} - x_{N}) de canal predeterminada, aplicando el modelo paramétrico (25) asociado, basándose en al menos los parámetros almacenados asociados con la parte de señal de sustitución precedente de la señal de entrada.
15. Método según cualquiera de las reivindicaciones 1 a 14, caracterizado por el paso adicional de:
enmudecer gradualmente los parámetros del modelo durante partes erróneas subsiguientes de la señal de canal predeterminada.
16. Método según cualquiera de las reivindicaciones 1 a 15, caracterizado porque las partes de las señales son tramas de señales digitales.
17. Método según la reivindicación 16, caracterizado porque el paso de detección comprende la supervisión de la información de estado de la trama.
18. Método según cualquiera de las reivindicaciones 1 a 15, caracterizado porque las partes de las señales son partes de señales analógicas que tienen duraciones uniformes.
19. Método según la reivindicación 18, caracterizado porque el paso de detección comprende el paso de analizar las características espectrales de las señales analógicas.
20. Método según la reivindicación 18 o 19, caracterizado por los pasos adicionales de:
convertir señales de canal analógicas en señales de canal digitales (\tilde{x}_{i});
donde el paso de obtener y almacenar parámetros (h_{k}) del modelo está basado en las señales de canal digitales (\tilde{x}_{i});
convertir las partes recuperadas de la señal digital en partes de la señal analógica; y
sustituir las partes erróneas de la señal analógica por las partes recuperadas de la señal analógica.
21. Método según cualquiera de las reivindicaciones 1 a 20, caracterizado porque las partes de la señal están limitadas a una gama de frecuencias.
22. Método según la reivindicación 21, caracterizado porque el método se aplica a sub-bandas de las señales multicanal.
23. Método según cualquiera de las reivindicaciones 1 a 22, caracterizado por los pasos adicionales de:
generar una segunda parte de la señal de sustitución para la parte errónea, de acuerdo con un segundo método de recuperación de señales temporales; y
combinar la primera y segunda partes de la señal de sustitución para obtener una parte de sustitución final, que se utiliza para sustituir la parte errónea de la señal de canal.
24. Método según cualquiera de las reivindicaciones 1 a 23, caracterizado porque el método se aplica recursivamente a más de una señal de canal errónea simultáneamente.
25. Dispositivo (20) de ocultación de errores de una señal de audio multicanal, que utiliza correlaciones entre canales,
caracterizado por
medios (22, 24) para obtener, por un procedimiento de optimización, y almacenar parámetros (h_{k}) de un modelo paramétrico (27) que da una estimación de partes de las señales (x_{1} - x_{N}) de canal predeterminadas, cuando se aplica a una señal de entrada obtenida;
medios (23) de investigación del estado de los errores de partes erróneas de las señales (x_{1} - x_{N}) de canal; y
medios (25) para generar una parte de la señal de sustitución de una parte errónea de la señal (x_{1} - x_{N}) de canal predeterminadas, conectados a los medios (22, 24) para obtener y almacenar parámetros (h_{k}) del modelo aplicando el modelo paramétrico asociado (25) basándose en los parámetros (h_{k}) almacenados, asociados con una señal precedente libre de errores, a una señal de entrada generada.
26. Sistema (1) de audio, que comprende el dispositivo (20) de ocultación de errores de señales multicanal, de acuerdo con la reivindicación 25.
\newpage
27. Sistema de audio, según la reivindicación 26, caracterizado porque el dispositivo de ocultación de errores de la señal multicanal está conectado o integrado con un receptor (16-18).
28. Sistema de audio según la reivindicación 26, caracterizado porque el dispositivo (20) de ocultación de errores de la señal multicanal está conectado a un sistema de señales analógicas de audio.
ES04809050T 2003-12-19 2004-12-15 Ocultacion de errores en sistemas multicanales de audio. Active ES2286714T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE0303500A SE0303500D0 (sv) 2003-12-19 2003-12-19 Frame loss concealment for multi-channel audio signal transmission
SE0303500 2003-12-19
SE0400416A SE527866C2 (sv) 2003-12-19 2004-02-20 Kanalsignalmaskering i multikanalsaudiosystem
SE0400416 2004-02-20

Publications (1)

Publication Number Publication Date
ES2286714T3 true ES2286714T3 (es) 2007-12-01

Family

ID=31996353

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04809050T Active ES2286714T3 (es) 2003-12-19 2004-12-15 Ocultacion de errores en sistemas multicanales de audio.

Country Status (8)

Country Link
EP (1) EP1649452B1 (es)
JP (1) JP4723490B2 (es)
AT (1) ATE365364T1 (es)
DE (1) DE602004007142T2 (es)
ES (1) ES2286714T3 (es)
PT (1) PT1649452E (es)
SE (1) SE527866C2 (es)
WO (1) WO2005059898A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4930320B2 (ja) * 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
JP5153791B2 (ja) * 2007-12-28 2013-02-27 パナソニック株式会社 ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US8644526B2 (en) 2008-06-27 2014-02-04 Panasonic Corporation Audio signal decoding device and balance adjustment method for audio signal decoding device
ATE557387T1 (de) * 2008-07-30 2012-05-15 France Telecom Rekonstruktion von mehrkanal-audiodaten
EP2378515B1 (en) * 2009-01-13 2013-09-25 Panasonic Corporation Audio signal decoding device and method of balance adjustment
KR101073409B1 (ko) * 2009-03-05 2011-10-17 주식회사 코아로직 디코딩 장치 및 디코딩 방법
WO2010134355A1 (ja) * 2009-05-22 2010-11-25 パナソニック株式会社 符号化装置、復号装置、およびこれらの方法
WO2010137300A1 (ja) * 2009-05-26 2010-12-02 パナソニック株式会社 復号装置及び復号方法
EP2761618B1 (en) * 2011-09-29 2016-11-30 Dolby International AB High quality detection in fm stereo radio signals
EP2709101B1 (en) 2012-09-13 2015-03-18 Nxp B.V. Digital audio processing system and method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3421962B2 (ja) * 1996-10-14 2003-06-30 日本電信電話株式会社 欠落音響信号合成処理方法
DE19721487A1 (de) * 1997-05-23 1998-11-26 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen
JP3567750B2 (ja) * 1998-08-10 2004-09-22 株式会社日立製作所 圧縮音声再生方法及び圧縮音声再生装置
DE60030069T2 (de) * 1999-11-23 2007-02-22 Texas Instruments Inc., Dallas Verschleierungsverfahren bei Verlust von Sprachrahmen
JP2001296894A (ja) * 2000-04-12 2001-10-26 Matsushita Electric Ind Co Ltd 音声処理装置および音声処理方法
DE10034783A1 (de) * 2000-07-18 2002-02-07 Bosch Gmbh Robert Verfahren zur Fehlerverschleierung von Übertragungsfehlern in digitalen Audiodaten
CN1705980A (zh) * 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
AU2002309146A1 (en) * 2002-06-14 2003-12-31 Nokia Corporation Enhanced error concealment for spatial audio
US20040083110A1 (en) * 2002-10-23 2004-04-29 Nokia Corporation Packet loss recovery based on music signal classification and mixing

Also Published As

Publication number Publication date
JP2007529020A (ja) 2007-10-18
DE602004007142D1 (de) 2007-08-02
EP1649452B1 (en) 2007-06-20
ATE365364T1 (de) 2007-07-15
EP1649452A1 (en) 2006-04-26
SE0400416L (sv) 2005-06-20
DE602004007142T2 (de) 2008-02-14
JP4723490B2 (ja) 2011-07-13
SE0400416D0 (sv) 2004-02-20
WO2005059898A1 (en) 2005-06-30
SE527866C2 (sv) 2006-06-27
PT1649452E (pt) 2007-08-08

Similar Documents

Publication Publication Date Title
US7835916B2 (en) Channel signal concealment in multi-channel audio systems
ES2387943T3 (es) Ocultación de error de transmisión en una señal de audio digital en una estructura de decodificación jerárquica
KR101291197B1 (ko) 오디오 신호 복호화 방법 및 장치
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
JP4731774B2 (ja) 高品質オーディオ用縮尺自在符号化方法
KR101265874B1 (ko) 로버스트 디코더
US7365671B1 (en) Communication channel with undersampled interpolative timing recovery
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
KR101203244B1 (ko) 통신 시스템에서 은닉 프레임들을 발생시키는 방법
TWI413107B (zh) 具有多重階段編碼簿及冗餘編碼之子頻帶語音編碼/解碼的方法
JPH07503115A (ja) サブバンド符号器における誤り防止保護方法
ES2286714T3 (es) Ocultacion de errores en sistemas multicanales de audio.
US8682680B2 (en) Methods and apparatuses for bit stream decoding in MP3 decoder
ES2209383T3 (es) Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision.
KR100263603B1 (ko) 재기록성 기록 매체상에서 및 그로부터 디지탈 신호를 레코딩 및 재생하는 시스템
KR20020002241A (ko) 디지털 오디오장치
TW200534654A (en) Adaptive Viterbi detector
KR20080075050A (ko) 오류 프레임의 파라미터 갱신 방법 및 장치
CN110770823B (zh) 基于数据包的高级采样音频隐藏
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
KR101261528B1 (ko) 복호화된 오디오 신호의 오류 은폐 방법 및 장치
US20200358453A1 (en) Method of error concealment, and associated device
KR20130069682A (ko) 오디오 복호화방법
MX2007015190A (es) Descodificador voluminoso