ES2443878T3

ES2443878T3 - Suministro de señal de marca de agua digital e incrustación de marca de agua digital

Info

Publication number: ES2443878T3
Application number: ES11705524.4T
Authority: ES
Inventors: Stefan Wabnik; Joerg Pickel; Bert Greevenbosch; Bernhard Grill; Ernst Eberlein; Giovanni Del Galdo; Stefan Kraegeloh; Reinhard Zitzmann; Tobias Bliem; Juliane Borsum; Marco Breiling
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2010-02-26
Filing date: 2011-02-22
Publication date: 2014-02-20
Anticipated expiration: 2031-02-22
Also published as: RU2012140842A; JP5548278B2; EP2539890A1; US20130218314A1; KR20120128148A; US8965547B2; CA2791046A1; RU2624549C2; MY152708A; ZA201207154B; AU2011219829A1; AU2011219829B2; CA2791046C; CN102959622B; EP2539890B1; JP2013520693A; SG183485A1; MX2012009778A; PL2539890T3; HK1180446A1

Abstract

Un proveedor de señal de marca de agua digital (2400) para suministrar una señal de marca de agua digital(2440; 101b) adecuada para ocultarse en una señal de audio (2430; 106) cuando la señal de marca de agua digitalse agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca deagua digital (2450; 101a), el proveedor de señal de marca de agua digital comprende: un procesador psicoacústico (2410; 102) para determinar un umbral de enmascarado de la señal de audio; yun modulador (2420; 307) para generar la señal de marca de agua digital a partir de una superposición defunciones de conformado de muestra espaciadas entre sí a un intervalo de tiempo (Tb) de muestra de unarepresentación discreta en tiempo de los datos de marca de agua digital, cada función de conformado demuestra se pondera en amplitud con una muestra respectiva de una representación discreta en tiempo,multiplicado por una ponderación de amplitud respectiva dependiente del umbral de enmascarado, elmodulador se configura de manera tal que el intervalo de tiempo de muestra es más corto que una extensión de tiempo de las funciones de conformadode muestra; y la ponderación de amplitud respectiva también depende de las muestras de la representación discreta entiempo vecinas a la muestra respectiva en tiempo.

Description

Suministro de señal de marca de agua digital e incrustación de marca de agua digital

Campo Técnico

[0001] La presente invención se refiere a un dispositivo de suministro de señal de marca de agua digital, para suministrar una señal de marca de agua digital e incrustación de marca de agua digital utilizando la señal de marca de agua digital.

10 Antecedentes de la Invención

[0002] En muchas aplicaciones técnicas, se desea incluir una información adicional en una señal que representa la información o datos útiles o "datos principales" como, por ejemplo, una señal de audio, una señal de vídeo, gráficos, una cantidad de medición y así sucesivamente. En muchos casos, se desea incluir la información adicional tal que la

15 información adicional está enlazada a los datos principales (por ejemplo, datos de audio, datos de vídeo, datos de imágenes fijas, datos de medición, datos de texto, etc.) en una forma que no es perceptible por un usuario de los datos mencionados. También, en algunos casos es deseable incluir los datos adicionales tales que los datos adicionales no son fácilmente extraíbles de los datos principales (por ejemplo, datos de audio, datos de vídeo, datos de imágenes fijas, datos de medición, y así sucesivamente).

20 [0003] Esto es particularmente cierto en las aplicaciones en las que es deseable para implementar administración de derechos digitales. Sin embargo, a veces se desea simplemente añadir información lateral o secundaria sustancialmente imperceptible a los datos útiles. Por ejemplo, en algunos casos es deseable añadir información lateral a los datos de audio, de tal manera que la información lateral proporciona una información sobre la fuente de los datos de audio, el contenido de los datos de audio, los derechos relacionados con los datos de audio y así

25 sucesivamente.

[0004] Para incrustar datos adicionales en datos útiles o "datos principales", un concepto llamado "marca de agua digital" puede ser utilizado. Conceptos de marcas de agua se han discutido en la literatura para muy diferentes tipos de datos útiles, como datos de audio, datos de imágenes fijas, datos de video, datos de texto y así sucesivamente.

[0005] A continuación, se darán algunas referencias en donde los conceptos de marcas de agua se discuten. Sin

30 embargo, la atención del lector se dirige también al vasto campo de la literatura de libros de texto y publicaciones relacionadas con marcas de agua digitales para más detalles.

[0006] DE-196 40 814 C2 describe un método de codificación para la introducción de una señal no audible datos en una señal de audio y un método para decodificar una señal de datos, que está incluido en una señal de audio en una forma no audible. El método de codificación para la introducción de una señal no audible datos en una señal de 35 audio comprende la conversión de la señal de audio en el dominio espectral. El método de codificación comprende también la determinación del umbral de enmascaramiento de la señal de audio y suministrar una señal de seudo ruido. El método de codificación también comprende proporcionar la señal de datos y multiplicando la señal de seudo ruido con la señal de datos, a fin de obtener una señal de datos de dispersión en frecuencia. El método de codificación comprende también la ponderación de la señal de datos de propagación con el umbral de

40 enmascaramiento y la superposición de la señal de audio y la señal de datos ponderada.

[0007] Además, WO 93/07689 describe un método y aparato para la identificación automática de un programa emitido por una estación de radio o por un canal de televisión, o grabada en un medio, mediante la adición de un mensaje codificado inaudible para la señal de sonido del programa, el mensaje identifica el canal o de la estación de difusión, el programa y / o la fecha exacta. En una modalidad discutida en dicho documento, la señal de sonido se 45 transmite a través de un convertidor analógico-digital a un procesador de datos que permita componentes de frecuencia que se separan, y permitiendo a la energía en algunos de los componentes de frecuencia que sea alterada de una manera predeterminada para formar un mensaje de identificación codificado. La salida del procesador de datos está conectada por un convertidor digital-analógico a una salida de audio para la radiodifusión o grabación de la señal de sonido. En otra modalidad discutida en dicho documento, un paso de banda analógico se

50 emplea para separar una banda de frecuencias de la señal de sonido, de manera que la energía en la banda separada puede ser así alterada para codificar la señal de sonido.

2

[0008] US 5,450,490 describe un aparato y métodos para la inclusión de un código que tiene al menos un componente de frecuencia de código en una señal de audio. Las capacidades de los diversos componentes de frecuencia en la señal de audio para enmascarar el componente de frecuencia de código para la audición humana se evalúan y sobre la base de estas evaluaciones se asigna una amplitud de la componente de frecuencia de

5 código. Métodos y aparatos para la detección de un código en una señal de audio codificada también se describen. Un componente de frecuencia de código en la señal de audio codificada se detecta sobre la base de una amplitud de código esperado o sobre una amplitud del ruido dentro de un rango de frecuencias de audio, incluyendo la frecuencia del componente de código.

[0009] WO 94/11989 describe un método y aparato para codificar/descodificar segmentos de difusión o grabados y

10 supervisar la exposición del auditorio a los mismos. Se describen métodos y aparatos para codificar y descodificar información en difusiones o señales de segmento grabados. En una modalidad descrita en el documento, un sistema de supervisión de auditorio codifica información de identificación en la porción de señal de audio de una difusión o un segmento grabado utilizando codificación de espectro expandido. El dispositivo de supervisión recibe una versión reproducida acústicamente de la difusión o señal grabada mediante un micrófono, descodifica la información de

15 identificación de la porción de señal de audio a pesar de interferencia ambiente significante y almacena esta información, proporcionando automáticamente un diario para el miembro del auditorio, que posteriormente se carga a una instalación centralizada. Un dispositivo de supervisión separado descodifica información adicional de la señal de difusión, que se acopla con la información diaria de auditorio en la instalación central. Este monitor puede enviar simultáneamente datos a la instalación centralizada utilizando una línea de teléfono de conexión por línea

20 conmutada, y recibe datos de la instalación centralizada a través de una señal codificada utilizando una técnica de espectro expandido y modulada con una señal de difusión de una tercera parte.

[0010] WO 95/27349 describe aparatos y métodos que incluyen códigos en señales de audio y descodificación. Un aparato y métodos para incluir un código que tiene cuando menos un componente de frecuencia de código en una señal de audio, se describe. Las capacidades de los diversos componentes de frecuencia en la señal de audio para

25 enmascarar el componente de frecuencia de código a la audición humana y basado en estas evaluaciones, una amplitud se asigna a los componentes de frecuencia de código. Métodos y aparatos para detectar un código en una señal de audio codificada también se describen. Un componente de frecuencia de código en la señal de audio codificada se detecta con base en una amplitud de código esperada o en una amplitud de interferencia dentro de un intervalo de componentes de frecuencia de audio incluyendo la frecuencia del componente de código.

30 [0011] DE 10 2008 014311 A describe otro dispositivo de incrustación de marca de agua digital conocido que comprende un proveedor de señal de marca de agua digital que utiliza un enmascarado de frecuencia psicoacústica para incrustar una marca de agua digital dentro de una corriente de datos de audio.

[0012] Sin embargo, cuando se inserta la información de marca de agua digital en un espectrograma de tiempo/frecuencia de una señal de audio, es difícil ocultar la información dla marca de agua digital por debajo del

35 umbral de enmascarado o encontrar una óptima compensación entre la asignación de la mayor energía posible a la información de marca de agua digital - de esta manera incrementando la capacidad de extracción en el lado del descodificador -, y manteniendo la información dla marca de agua digital que se incrusta, inaudible cuando se reproduce la señal de sello de audio de agua digital.

40 Descripción de la Invención

[0013] En vista de esta situación, es el objeto de la presente invención proporcionar un esquema para suministrar una señal de marca de agua digital y un esquema para incrustación de marca de agua digital utilizando esa señal de marca de agua digital, que permite una mejor compensación entre la capacidad de extracción y la incapacidad

45 audible de la señal de marca de agua digital.

[0014] Este objetivo se logra por un generador de señal de marca de agua digital de acuerdo con la reivindicación 1, un incrustador de marca de agua digital de acuerdo con la reivindicación 8, métodos de acuerdo con la reivindicación 9 ó 10 y un programa de computadora de acuerdo con la reivindicación 11.

[0015] De acuerdo con una modalidad de la presente invención, un proveedor de señal de marca de agua digital

50 para proporcionar una señal de marca de agua digital adecuada para ocultar en una señal de audio cuando la señal de marca de agua digital se agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca de agua digital, comprende un procesador psicoacústico para determinar un umbral de enmascarado de la señal de audio; y un modulador para generar la señal de marca de agua digital a partir de una superposición de funciones de conformado de muestra, espaciadas entre sí a un intervalo de tiempo de muestra de una representación discreta en tiempo de los datos de marca de agua digital, cada función de conformado de muestra se pondera en amplitud con una muestra respectiva de la representación discreta en tiempo multiplicada por una ponderación de amplitud respectiva dependiendo del umbral de enmascarado, el modulador se configura de manera tal que el intervalo de tiempo de muestra es más corto que una extensión de tiempo de las funciones de

5 conformado de muestra; y la ponderación de amplitud respectiva también depende de las muestras de la representación discreta en tiempo vecina a la muestra respectiva en tiempo.

[0016] La presente invención se basa en el hallazgo de que puede lograrse una mejor compensación entre la capacidad de extracción y la incapacidad audible de la señal de marca de agua digital al seleccionar las ponderaciones de amplitud para ponderar en amplitud las funciones de conformado de muestra, que forman en 10 superposición, la señal de marca de agua digital, no solo dependiente del umbral de enmascarado, sino también dependiente de muestras de la representación discreta en tiempo de los datos de marca de agua digital vecinos a la muestra respectiva. De esta manera, las funciones de conformado de muestra en posiciones de muestra vecinas pueden superponerse entre sí, es decir el intervalo de tiempo de muestra puede ser más corto que la extensión de tiempo de la función de conformado de muestra y a pesar de esto, la interferencia entre estas funciones de 15 conformado de muestra puede compensarse al tomar en cuenta muestras de la representación discreta en tiempo vecina a la muestra ponderada actualmente cuando se ajusta la ponderación de amplitud. Aún más, ya que las funciones de conformado de muestra se permite que tengan una extensión de tiempo más grande, sus respuestas de frecuencia pueden hacerse más estrechas, de esta manera haciendo la capacidad de extracción de la señal de marca de agua digital más fuerte contra reverberación, es decir cuando la señal de audio con marca de agua se

20 reproduce en un ambiente reverberante. En otras palabras, la dependencia de la ponderación de amplitud respectiva no solo en el umbral de enmascarado, sino también en muestras de la representación discreta en tiempo de los datos de marca de agua digital vecinos a la muestra respectiva, permite compensación de interferencias de audio entre funciones de conformado de muestra vecina, que de otra forma puede llevar a una violencia del umbral de enmascarado.

Breve Descripción de las Figuras

[0017] Modalidades de acuerdo con la invención se describirán subsecuentemente tomando referencia a las figuras anexas, en donde:

30 La Figura 1 muestra un diagrama esquemático de bloques de un insertador de marca de agua digital de acuerdo con una modalidad de la invención;

La Figura 2 muestra un diagrama esquemático de bloques de un descodificador de marca de agua digital, de acuerdo con una modalidad de la invención;

La Figura 3 muestra un diagrama esquemático de bloques detallado de un generador de marca de agua 35 digital de acuerdo con una modalidad de la invención;

La Figura 4 muestra un diagrama esquemático de bloques detallado de un modulador, para utilizar en una modalidad de la invención;

La Figura 5 muestra un diagrama esquemático de bloques detallado de un módulo de procesamiento psicoacústico para utilizar en una modalidad de la invención;

40 La Figura 6 muestra un diagrama esquemático de bloques de un procesador de modelo psicoacústico para utilizar en una modalidad de la invención;

La Figura 7 muestra una representación gráfica de un espectro de energía de una salida de señal de audio por el bloque 801 sobre frecuencia;

La Figura 8 muestra una representación gráfica de un espectro de energía de una salida de señal de audio 45 por el bloque 802 sobre frecuencia;

La Figura 9 muestra un diagrama esquemático de bloques de un cálculo de amplitud;

La Figura 10a muestra un diagrama esquemático de bloques de un modulador;

La Figura 10b muestra una representación gráfica de la ubicación de coeficientes en la reivindicación de frecuencia-tiempo;

Las Figuras 11a y 11b muestran diagramas esquemáticos de bloques de alternativas de implementación del

módulo de sincronización; La Figura 12a muestra una representación gráfica del problema de hallar el alineamiento temporal de una marca de agua digital;

5 La Figura 12b muestra una representación gráfica del problema de identificar el inicio de mensaje;

La Figura 12c muestra una representación gráfica de un alineamiento temporal de secuencias de sincronización en un modo de sincronización de mensaje completo; La Figura 12d muestra una representación gráfica del alineamiento temporal de las secuencias de

sincronización en un modo de sincronización de mensaje parcial;

10 La Figura 12e muestra una representación gráfica de datos de alimentación del módulo de sincronización; La Figura 12f muestra una representación gráfica de un concepto para identificar un bit de sincronización; La Figura 12g muestra un diagrama esquemático de bloques de un correlacionador de firma de

sincronización; La Figura 13a muestra una representación gráfica de un ejemplo de concentrado temporal;

15 La Figura 13b muestra una representación gráfica de un ejemplo para una multiplicación a manera de elemento entre bits y secuencias de concentrado; La Figura 13c muestra una representación gráfica de una salida del correlacionador de firma de

sincronización después de promedio temporal; La Figura 13d muestra una representación gráfica de la salida de un correlacionador de firma de 20 sincronización filtrado con sincronización con la función de autocorrelación de la firma de sincronización;

La Figura 14 muestra un diagrama esquemático de bloques de un extractor de marca de agua digital de acuerdo con una modalidad de la invención; La Figura 15 muestra una representación esquemática de una selección de una parte de la representación de

dominio-frecuencia-tiempo como un mensaje candidato;

25 La Figura 16 muestra un diagrama esquemático de bloques de un módulo de análisis; La Figura 17a muestra una representación gráfica de una salida de un correlacionador de sincronización; La Figura 17b muestra una representación gráfica de mensajes descodificados; La Figura 17c muestra una representación gráfica de una posición de sincronización que se extrae de una

señal de marca de agua digital; 30 La Figura 18a muestra una representación gráfica de una carga útil, una carga útil con secuencia de

terminación Viterbi, una carga útil codificada Viterbi y una versión codificada de repetición de la carga útil codificada Viterbi; La Figura 18b muestra una representación gráfica de sub-portadoras utilizadas para incrustar una señal de

marca de agua digital; 35 La Figura 19 muestra una representación gráfica de un mensaje no codificado, de un mensaje codificado, un

mensaje de sincronización y una señal de marca de agua digital, en donde la secuencia de sincronización se aplica a los mensajes; La Figura 20 muestra una representación esquemática de una primera etapa de un concepto así llamado

“sincronización ABC”;

40 La Figura 21 muestra una representación gráfica de una segunda etapa del concepto así llamado “sincronización ABC”; La Figura 22 muestra una representación gráfica de una tercera etapa del concepto así llamado

“sincronización ABC”; La Figura 23 muestra una representación gráfica de un mensaje que comprende una carga útil y una porción 45 CRC;

La Figura 24 muestra un diagrama esquemático de bloques de un proveedor de señal de marca de agua digital de acuerdo con una modalidad de la invención; y

La Figura 25 muestra un diagrama esquemático de bloques de un incrustador de sello o marca de agua digital de acuerdo con una modalidad de la invención.

Descripción Detallada de las Modalidades

1. Suministro de señal de marca o marca de agua digital

[0018] A continuación, un proveedor de señal de sello o marca de agua digital 2400 se describirá con referencia a

10 la Figura 24. El proveedor de señal de marca de agua digital 2400 comprende un procesador psicoacústico 2410 y un modulador 2420. El procesador psicoacústico 2410 se configura para recibir la señal de audio 2430, para lo cual el proveedor de señal de marca de agua digital 2400 va a proporcionar la señal de marca de agua digital 2440. El modulador 2420 a su vez se configura para usar el umbral de enmascarado que se proporciona por el procesador psicoacústico 2410 para generar la señal de marca de agua digital 2440. En particular, el modulador 2420 se

15 configura para generar la señal de marca de agua digital 2440 desde una superposición de funciones de conformado de muestra espaciadas entre sí a un intervalo de tiempo de muestra de una representación discreta en tiempo de los datos de marca de agua digital 2450 para ser representados por la señal de marca de agua digital 2440. En particular, el modulador 2420 utiliza el umbral de enmascarado cuando se genera la señal de marca de agua digital 2440, de manera tal que la señal de marca de agua digital 2440 es adecuada para ocultarse en la señal de audio

20 2430 cuando la señal de marca de agua digital 2440 se agrega a la señal de audio 2430, para obtener una señal de audio con marca de agua digital.

[0019] Como se describe con más detalle a continuación, la representación discreta en tiempo de los datos de marca de agua digital puede de hecho ser una representación discreta en tiempo/frecuencia y puede derivarse de los datos de marca de agua digital 2450 por uso de propagación en dominio de tiempo y/o dominio de frecuencia. La 25 cuadrícula de tiempo o tiempo/frecuencia a las posiciones de cuadrículas de las cuales se asignan las muestras de la representación discreta en tiempo, pueden fijarse en tiempo y especialmente independiente de la señal de audio 2430. La superposición, a su vez puede interpretarse como una convolución de la representación discreta en tiempo que tiene sus muestras dispuestas en las posiciones de cuadrícula de la cuadrícula recién mencionada, las muestras se ponderan en amplitud que, a su vez no solo dependen del umbral de enmascarado sino también de las muestras

30 de la representación discreta en tiempo vecina en tiempo.

[0020] La dependencia de las ponderaciones de amplitud a partir del umbral de enmascarado puede ser como sigue: una ponderación de amplitud que es para multiplicar con una cierta muestra de la representación discreta en tiempo en un cierto bloque de tiempo, se deriva del bloque de tiempo respectivo del umbral de enmascarado que, a su vez es de por sí dependiente de tiempo y frecuencia. De esta manera, en el caso de una representación discreta

35 en frecuencia/tiempo de los datos de marca de agua digital, cada muestra se multiplica con una ponderación de amplitud que corresponde a un umbral de enmascarado muestreado en la posición de cuadrícula de frecuencia/tiempo respectiva de esa muestra de representación de marca de agua digital.

[0021] Además, es posible utilizar codificación diferencial en tiempo para recuperar la representación discreta en tiempo de los datos de marca de agua digital 2450. Detalles de una modalidad específica se describen a

40 continuación.

[0022] El modulador 2420 se configura para generar la señal de marca de agua digital 2440 a partir de la superposición de las funciones de conformado de muestra de manera tal que cada función de conformado de muestra se pondera en amplitud con una muestra respectiva de la representación discreta en tiempo multiplicada por una ponderación de amplitud respectiva dependiente del umbral de enmascarado que se determina por el

45 procesador psicoacústico 2410. En particular, el modulador 2420 se configura de manera tal que el intervalo de tiempo de muestra es más corto que una extensión de tiempo de la función de conformado de muestra, y tal que la ponderación de amplitud respectiva también depende de las muestras de la representación discreta en tiempo vecinas a la muestra respectiva.

[0023] Como se establecerá con más detalle a continuación, el hecho de que el intervalo de tiempo de muestra es

50 más corto que la extensión de tiempo de las funciones de conformado de muestra, resulta en una interferencia entre las funciones de conformado de muestra vecinas en tiempo, de esta manera incrementando el riesgo de violación por accidente del umbral de enmascarado. Esta violencia del umbral de enmascarado, sin embargo se compensa al hacer las ponderaciones de amplitud también dependientes de las muestras de la representación discreta en tiempo vecina a la muestra actual.

[0024] En la modalidad para un sistema de marca de agua digital perfilado a continuación, la dependencia recién mencionada se logra por un ajuste iterativo de las ponderaciones de amplitud. En particular, el procesador psicoacústico 2410 puede determinar el umbral de enmascarado independiente de los datos de marca de agua digital, mientras que el modulador 2420 puede configurarse para ajustar en forma iterativa las ponderaciones de 5 amplitud al determinar en forma preliminar las ponderaciones de amplitud con base en el umbral de enmascarado independiente de los datos de marca de agua digital. El modulador 2420 puede entonces configurarse para verificar si la superposición de las funciones de conformado de muestra como ponderadas en amplitud con las muestras de la representación de marca de agua digital representación multiplicado por las ponderaciones de amplitud determinadas preliminarmente, viola el umbral de enmascarado. De ser así, el modulador 2420 puede variar las 10 ponderaciones de amplitud determinadas preliminarmente para obtener una superposición adicional. El modulador 2420 puede repetir estas iteraciones que comprenden la verificación y la variación con la superposición subsecuente hasta que se cumple una condición de ruptura respectiva tal como las ponderaciones de amplitud que mantienen sus valores dentro de un cierto umbral de variancia. Ya que en la verificación anteriormente mencionada, las muestras vecinas de la representación discreta en tiempo influencian/interfieren entre sí debido a superposición y la

15 extensión de tiempo de las funciones de conformado de muestra excede el intervalo de tiempo de muestra, todo el proceso iterativo para generación depende de estas muestras vecinas de la representación de datos de marca de agua digital.

[0025] Habrá de notarse que en las modalidades anteriormente perfiladas, una propagación de los datos de marca de agua digital en dominio de tiempo se emplea a fin de revelar la representación discreta en tiempo recién

20 mencionada. Sin embargo, esta propagación en tiempo puede apartarse. Lo mismo aplica a la propagación de frecuencia también empleada en las modalidades establecidas a continuación.

2. Aparato de incrustación de marca de agua digital

[0026] La Figura 25 muestra un aparato incrustador de marca de agua digital que utiliza el proveedor de señal de

25 marca de agua digital 2400 de la Figura 24. En particular, el aparato de incrustación de marca de agua digital de la Figura 25 en general se indica con el número de referencia 2500 y comprende, además del proveedor dla marca de agua digital 2400, un sumador 2510 para agregar la señal de marca de agua digital 2440 como salida por el proveedor de señal de marca de agua digital 2400 y la señal de audio 2430 para obtener la señal de audio de marca de agua digital 2530.

3. Descripción del Sistema

[0027] A continuación, se describirá un sistema para transmisión de marca de agua digital, que comprende un insertador de marca de agua digital y un descodificador de marca de agua digital. Naturalmente, el insertador de marca de agua digital y el descodificador de marca de agua digital pueden emplearse independientemente entre sí.

35 [0028] Para la descripción del sistema, un enfoque jerárquico del sistema aquí se elige. Primero, se distingue entre codificador y descodificador. Después, en las secciones 3.1 a 3.5 se describe en detalle cada bloque de procesamiento.

[0029] La estructura básica del sistema puede verse en las Figuras 1 y 2, que ilustran el lado codificador y descodificador, respectivamente. La Figura 1 muestra un diagrama esquemático de bloques de un insertador de 40 marca de agua digital 100. En el lado codificador, la señal de marca de agua digital 101b se genera en el bloque de procesamiento 101 (también designado como generador de marca de agua digital) a partir de datos binarios 101a y en base a información 104, 105 intercambia con el módulo de procesamiento psicoacústico 102. La información que se proporciona del bloque 102 típicamente garantiza que la marca de agua digital sea inaudible. La marca de agua digital producida por el generador de marca de agua digital 101 después se agrega a la señal de audio 106. La 45 señal de marca de agua digital 107 puede entonces ser transmitida, almacenada o procesada adicionalmente. En caso de un archivo de multimedia, por ejemplo un archivo de audio-video, se requiere agregar un retardo adecuado a la corriente de video para no perder la sincronía de audio-video. En caso de una señal de audio de múltiples canales, cada canal se procesa por separado como se explica en este documento. Los bloques de procesamiento 101 (generador de marca de agua digital) y 102 (módulo de procesamiento psicoacústico) se explican en detalle en

50 las Secciones 3.1 y 3.2, respectivamente.

[0030] El lado descodificador se ilustra en la Figura 2, que muestra un diagrama esquemático de bloques de un detector de marca de agua digital 200. Una señal de audio con marca de agua digital 200a, por ejemplo registrada por un micrófono, se hace disponible al sistema 200. Un primer bloque 203, que también se designa como un módulo de análisis, desmodula y transforma los datos (por ejemplo, la señal de audio con marca de agua digital) en dominio de tiempo/frecuencia (de esta manera obteniendo una representación de dominio-frecuencia-tiempo 204 de la señal de audio con marca de agua digital 200a) la pasa al módulo de sincronización 201, que analiza la señal de alimentación 204 y transporta una sincronización temporal, es decir determina el alineamiento temporal de los datos codificados (por ejemplo de los datos de marca de agua digital codificados respecto a la representación de dominio

5 frecuencia-tiempo). Esta información (por ejemplo, la información de sincronización resultante 205) se da al extractor de marca de agua digital 202, que descodifica los datos (y consecuentemente proporciona los datos binarios 202a, que representan el contenido de datos de la señal de audio con marca de agua digital 200a).

3.1 El generador de marca de agua digital 101

10 [0031] El generador de marca de agua digital 101 se ilustra en detalla en la Figura 3. Datos binarios (expresados como ±1) para ocultar la señal de audio 106 se dan al generador de marca de agua digital 101. El bloque 301 organiza los datos 101a en un paquete de igual longitud Mp. Se agregan bits suplementarios (por ejemplo, añadidos) para propósitos de señalización a cada paquete. Sea Ms que denote su número. Su uso se explicará en detalle en la Sección 3.5. Hay que notar que a continuación cada paquete de bits de carga útil junto con los bits

15 suplementarios de señalización se denota mensaje.

[0032] Cada mensaje 301a de longitud Nm = Ms + Mp, se transfiere al bloque de procesamiento 302, el codificador de canal, que es responsable por codificar los bits para protección contra errores. Una modalidad posible de este módulo consiste de un codificador convolucional junto con un intercalador. La proporción del codificador convolucional influencia enormemente el grado total de protección contra errores del sistema de marca de agua

20 digital. El intercalador, por otra parte, lleva protección contra ráfagas de interferencia o ruido. El intervalo de operación del intercalador puede estar limitado a un mensaje, pero también puede extenderse a más mensajes. Sea Rc que denote la proporción de código, por ejemplo 1/4. El número de bits codificados por cada mensaje es Nm/Rc. El codificador de canal proporciona por ejemplo, un mensaje binario codificado 302a.

[0033] El siguiente bloque de procesamiento, 303 transporta una propagación o ensanchado en dominio de

25 frecuencia. A fin de lograr suficiente proporción de señal a interferencia, la información (por ejemplo, la información del mensaje binario 302a) se propaga y transmite en Nf sub-bandas cuidadosamente seleccionadas. Su posición exacta en frecuencia se decide a priori y se conoce tanto para el codificador como el descodificador. Detalles en la selección de este parámetro de sistema importante se dan en la Sección 3.2.2. La propagación en frecuencia se determina por la secuencia de propagación Cf con tamaño Nf X1. La salida 303 del bloque 303 consiste de

30 Nf Corrientes de bits, una por cada sub-banda. La corriente de bits i-ésima se obtiene al multiplicar el bit de alimentación con el componente i-ésimo de la secuencia de propagación Cf. La propagación más simple consiste de copiar la corriente de bits a cada corriente de salida, es decir uso de una secuencia de propagación de todos los unos.

[0034] El bloque 304, que también se designa como un insertador de esquema de sincronización, agrega una

35 señal de sincronización a la corriente de bits. Una sincronización robusta es importante ya que el descodificador no sabe el alineamiento temporal ni de bits ni de la estructura de datos, es decir, cuando empieza cada mensaje. La señal de sincronización consiste de Ns secuencias de Nf bits cada una. Las secuencias son elementos de forma multiplicada y periódicamente a la corriente de bit (o Corrientes de bits 303a). Por ejemplo, sean a, b, y c, las Ns = 3 secuencias de sincronización (también designadas como secuencias de propagación de sincronización). El bloque

40 304 multiplica a al primer bit de propagación, b al segundo bit de propagación y c al tercer bit de propagación. Para los siguientes bits, el proceso se itera periódicamente, es decir a al cuarto bit, b para el quinto bit y así en adelante. De acuerdo con esto, se obtiene una información de sincronización-información combinada 304a. Las secuencias de sincronización (también designadas como secuencias de propagación de sincronización) se eligen cuidadosamente para reducir al mínimo el riesgo de una sincronización falsa. Se dan más detalles en la Sección

45 3.4. También, habrá de notarse que una secuencia a, b, c,... puede ser considerada como una secuencia de secuencias de propagación de sincronización.

[0035] El bloque 305 transporta una propagación en dominio de tiempo. Cada bit de propagación a la entrada, es decir un vector de longitud Nf, se repite en dominio de tiempo Nt tiempos. De manera similar a la propagación en frecuencia, definimos una secuencia de propagación ct con tamaño Ntx1. La repetición temporal i-ésima se

50 multiplica con el componente i-ésimo de ct.

[0036] Las operaciones de los bloques 302 a 305 pueden ponerse en términos matemáticos como sigue. Sea m de tamaño 1 un mensaje codificador, salida de 302. La salida 303a (que puede considerarse como una representación de información de propagación R) del bloque 303 es

cf · m con tamaño Nf x Nm/Rc

(1) la salida 304a del bloque 304, que puede considerarse como una representación combinada de sincronización

información C, es

S ° ( cf · m) de tamaño Nf x Nm/Rc

5: (2)

en donde °denota el producto por elementos Schur - y

S = [ . . . a b c . . . a b . . . ] de tamaño Nf x Nm/Rc

(3)

[0037]: La salida 305a de 305 es

10: (S ° ( cf · m)) o cT t de tamaño Nf x Nt · Nm/Rc

(4)

en donde ° y T denotan el producto Kronecker y transposición, respectivamente. Hay que recordar por favor que los datos binarios se expresan como ±1.

[0038] El bloque 306 realiza una codificación diferencial de los bits. Esta etapa da al sistema robusteza adicional

15 contra desplazamientos de fase debido a movimiento o discordancias de oscilador local. Más detalles en este asunto se dan en la Sección 3.3. Si b(i; j) es el bit para la banda de frecuencia i-ésima y el bloque de tiempo j-ésimo a la entrada del bloque 306, el bit de salida bdiff (i; j) es

bdiff(i, j) = bdiff i, j - 1) · b(i, j) .

(5)

20 [0039] Al inicio de la corriente, esto es para j = 0, bdiff (i,j - 1) se ajusta a 1.

[0040] El bloque 307 transporta la modulación actual, es decir, la generación de la forma de onda de la señal de marca de agua digital dependiendo de la información binaria 306a dada en su alimentación. Un esquemático más detallado se da en la Figura 4. Nf alimentaciones paralelas, 401 a 40Nf contienen las corrientes de bit para las subbandas diferentes. Cada bit de cada corriente de sub-banda se procesa por un bloque de conformado de bit (411 a

25 41Nf). La salida de los bloques de conformado de bit son formas de onda en dominio de tiempo. La forma de onda generada para el bloque de tiempo j-ésimo y la sub-banda i-ésima denotado por Si,j(t), en base al bit de alimentación bdiff (i, j) se calcula como sigue

(6)

en donde y(i, j) es un factor de ponderación que se proporciona por la unidad de procesamiento psicoacústico 102, Tb es el intervalo de tiempo de bits, y gi(t) es la función de formación de bits para la sub-banda i-ésima. La función de formación de bit se obtiene a partir de una función de banda base giT(t) modulada en frecuencia con un coseno

(7)

en donde fi es la frecuencia central de la sub-banda i-ésima y el superíndice T representa el transmisor. Las funciones de banda base pueden ser diferentes para cada sub-banda. Si se eligen idénticas, es posible una implementación más eficiente en el descodificador. Ver Sección 3.3 para más detalles.

40 [0041] Conformado de bit para cada bit se repite en un proceso iterativo controlado por el módulo de procesamiento psicoacústico (102). Son necesarias iteraciones para ajuste fino de los pesos y(i, j) para asignar la mayor energía posible a la marca de agua digital mientras que se mantiene inaudible. Se dan más detalles en la Sección 3.2.

[0042] La forma de onda completa a la salida del filtro para conformado de bit i-ésimo 4li es

(8)

[0043] El bit que forma la función de banda base giT(t) normalmente no es cero para un intervalo de tiempo mucho más grande que Tb, aunque la energía principal se concentra dentro del intervalo de bit. Un ejemplo puede verse en 5 la Figura 12a, en donde el mismo bit que forma la función de banda base se traza para dos bits adyacentes. En la figura tenemos Tb = 40 ms. La selección de Tb así como la forma de la función afecta considerablemente al sistema. De hecho, símbolos más largos proporcionan respuestas de frecuencia más estrechas. Esto es particularmente benéfico en ambientes reverberantes. De hecho, en estos escenarios, la señal de marca de agua digital llega al micrófono por varias rutas de propagación, cada una caracterizada por un tiempo de propagación diferente. El canal 10 resultante exhibe fuerte selectividad de frecuencia. Interpretado en dominio de tiempo, símbolos más largos son benéficos como ecos con un retraso comparable con la interferencia constructiva que rinde el intervalo de bit, lo que significa que aumentan la energía de señal recibida. No obstante, símbolos más largos pueden también acarrear algunas cuentas desventajas; más grandes superposiciones pueden llevar a interferencia inter símbolos (IS I) y con seguridad son más difíciles de ocultar en la señal de audio, de manera tal que el módulo de procesamiento

15 psicoacústico permitirá menos energía que para símbolos más cortos.

[0044] La señal de marca de agua digital se obtiene al sumar todas las salidas de los filtros para conformado de bit

(9)

3.2 El Módulo de Procesamiento psicoacústico 102

[0045] Como se ilustra en la Figura 5, el módulo de procesamiento psicoacústico 102 consiste de 3 partes. La primera etapa es un módulo de análisis 501 que transforma la señal de audio en tiempo en un dominio de tiempo/frecuencia. Este módulo de análisis puede transportar análisis paralelos en diferentes resoluciones de 25 tiempo/frecuencia. Después del módulo de análisis, los datos de tiempo/frecuencia se transfieren al modelo psicoacústico (PAM) 502, en donde umbrales de mascarado para la señal de marca de agua digital se calculan de acuerdo con consideraciones psicoacústicas (ver E. Zwicker H. Fastl, "Psychoacoustics Facts and models"). Los umbrales de enmascarado indican la cantidad de energía que puede ocultarse en la señal de audio para cada subbanda y bloque de tiempo. El último bloque en el módulo de procesamiento psicoacústico 102 ilustra el módulo de

30 cálculo de amplitud 503. Este módulo determina las ganancias de amplitud a utilizar en la generación de la señal de marca de agua digital, de manera tal que se satisfacen los umbrales de enmascarado, es decir la energía incrustada es menos o igual a la energía definida por los umbrales de enmascarado.

3.2.1 El Análisis de Tiempo/Frecuencia 501

35 [0046] El bloque 501 transporta la transformación de tiempo/frecuencia de la señal de audio mediante una transformada traslapada. La mejor calidad de audio puede lograrse cuando se realizan múltiples resoluciones de tiempo/frecuencia. Una modalidad eficiente de una transformada traslapada es la transformada Fourier de corto tiempo (STFT = short time Fourier transform), que se basa en transformadas Fourier rápidas (FFT = fast Fourier transforms) de bloqueos de tiempo en ventanas. La longitud de la ventana determina la resolución de

40 tiempo/frecuencia, de manera tal que más largas ventanas producen resoluciones de menor tiempo y superior frecuencia, mientras que más cortas ventanas vice versa. La forma de la ventana, por otra parte, entre otras cosas, determina la fuga de frecuencia.

[0047] Para el sistema propuesto, logramos una marca de agua inaudible al analizar los datos con dos resoluciones diferentes. Un primer banco de filtros se caracteriza por un tamaño de salto de Tb, es decir la longitud

45 de bit. El tamaño de salto es el intervalo de tiempo entre dos bloques de tiempo adyacentes. La longitud de ventana es de aproximadamente Tb. Por favor note que la forma de la ventana no tiene que ser la misma que la empleada para el conformado de bit, y en general deberá modelar el sistema auditivo humano. Numerosas publicaciones estudian este problema.

[0048] El segundo banco de filtros aplica una ventana más corta. La superior resolución temporal lograda es

50 particularmente importante cuando se incrusta una marca de agua digital en habla, ya que su estructura temporal, en general es más fina que Tb.

[0049] La velocidad de muestreado de la señal de audio de alimentación no es importante, siempre que sea suficientemente grande para describir la señal de marca de agua sin solapamiento. Por ejemplo, si el componente de más grande frecuencia contenido en la señal de marca de agua digital es 6 kHz, entonces la velocidad de muestreado de las señales de tiempo debe ser al menos 12 kHz.

3.2.2 El Modelo psicoacústico 502

[0050] El modelo psicoacústico 502 tiene la tarea de determinar los umbrales de enmascarado, es decir, la cantidad de energía que puede ocultarse en la señal de audio por cada sub-banda y bloque el tiempo manteniendo la señal de audio con marca de agua digital indistinguible de la original.

(min)(max)

10 [0051] La sub-banda i-ésima se define entre dos límites, es decir fi y fi. Las sub-bandas se determinan al

(max)

definir Nf frecuencias centrales fi y siendo fi-1 = fi(min) i para i = 2, 3, ... , Nf. Una selección apropiada para las frecuencias centrales se da por la escala Bark propuesta por Zwicker en 1961. Las sub-bandas se vuelven más grandes para superiores frecuencias centrales. Una implementación posible del sistema utiliza 9 sub-bandas en el intervalo de 1.5 a 6 kHz dispuestas en una forma apropiada.

15 [0052] Las siguientes etapas de procesamiento se llevan a cabo por separado por cada resolución de tiempo/frecuencia por cada sub-banda y cada bloque de tiempo. La etapa de procesamiento 801 lleva a cabo un alisado espectral. De hecho, elementos tonales, así como muescas en el espectro de energía requieren ser alisados. Esto puede llevarse a cabo de varias formas. Una medida de tonalidad puede ser calculada y después utilizada para dirigir un filtro de alisado adaptivo. En forma alterna, en una implementación más simple de este

20 bloque, puede emplearse un filtro tipo mediana. El filtro de mediana considera un vector de valores y envía de salida su valor de mediana. En un filtro tipo mediana, el valor que corresponde a un cuantil diferente que 50% puede seleccionarse. El ancho de filtro se define en Hz y se aplica como un promedio en movimiento no lineal que empieza a las menores frecuencias y termina a la frecuencia más alta posible. La operación de 801 se ilustra en la Figura 7. La curva roja es la salida del alisado.

25 [0053] Una vez que se ha llevado a cabo el alisado, los umbrales se calculan por el bloque 802 considerando solo enmascarado de frecuencia. También, en este caso hay diferentes posibilidades. Una forma es utilizar el mínimo para cada sub-banda para calcular la energía de enmascarado Ei. Esta es la energía equivalente de la señal que efectivamente opera como un enmascarado. De este valor, nosotros podemos simplemente multiplicar un cierto factor de ajuste en escala para obtener la energía enmascarada Ji. Estos factores son diferentes para cada sub

30 banda y resolución de tiempo/frecuencia y se obtienen por experimentos psicoacústicos empíricos. Estas etapas se ilustran en la Figura 8.

[0054] En el bloque 805, se considera enmascarado temporal. En este caso, diferentes bloques de tiempo para la misma sub-banda se analizan. Las energías enmascaradas Ji se modifican de acuerdo con un perfil de postenmascarado derivado en forma empírica. Consideremos dos bloques de tiempo adyacentes, es decir k-1 y k. Las 35 energías de enmascarados correspondientes son Ji(k-l) y Jj(k). El perfil de post-enmascarado define que, por ejemplo la energía de enmascarado Ej puede enmascarar una energía Ji al tiempo k y a·Ji al tiempo k+1. En este caso, el bloque 805 compara Jj(k) (la energía enmascarada por el bloque de tiempo actual) y a·Ji(k+1) (la energía enmascarada por el bloque de tiempo previo) y selecciona el máximo. Perfiles de post-enmascarado están disponibles en la literatura y se han obtenido por experimentos psicoacústicos empíricos. Hay que notar que para

40 una gran Tb, es decir > 20 ms, se aplica post-enmascarado solo a la resolución de tiempo/frecuencia con ventanas de tiempo más corto.

[0055] Resumiendo, a la salida del bloque 805 tenemos los umbrales de enmascarado por cada sub-banda y bloque de tiempo que se obtienen para dos diferentes resoluciones de tiempo/frecuencia. Los umbrales se han obtenido al considerar tanto fenómenos de enmascarados tiempo como frecuencia. En el bloque 806, los umbrales

45 para las diferentes resoluciones de tiempo/frecuencia se fusionan. Por ejemplo, una implementación posible es que 806 considera todos los umbrales correspondientes a los intervalos de tiempos y frecuencia en donde se asigna un bit, y selecciona el mínimo.

3.2.3 El Bloque de Cálculo de Amplitud 503

50 [0056] Por favor haga referencia a la Figura 9. La alimentación de 503 son los umbrales 505 del modelo psicoacústico 502 en donde todos los cálculos motivados psicoacústicos se llevan a cabo. En la calculadora de amplitud 503, se realizan adicionales cálculos con los umbrales. Primero, un mapeo de amplitud 901 se lleva a cabo. Este bloque solamente convierte los umbrales de enmascarado (expresados normalmente como energía) en amplitudes que pueden emplearse para ajustar en escala la función de conformado de bit definida en la Sección 3.1.

Posteriormente, el bloque de adaptación de amplitud 902 se ejecuta. Este bloque adapta en forma iterativa las amplitudes y(i, j) que se emplean para multiplicar las funciones de conformado de bit en el generador de marca de agua digital 101, de manera tal que los umbrales de enmascarado sin duda se llenan. De hecho, como ya se discutió, la función de conformado de bit normalmente se extiende por un intervalo de tiempo mayor que Tb. Por lo 5 tanto, multiplicar la amplitud correcta y(i, j) que cumple con el umbral de enmascarado en el punto i, j no necesariamente cumple los requerimientos en el punto i, j-1. Esto es particularmente crucial en fuertes inicios, ya que se vuelve audible un pre-eco. Otra situación que requiere ser evitada es la superposición desafortunada en las colas de diferentes bits que pueden llevar a una marca de agua digital audible. Por lo tanto, el bloque 902 analiza la señal generada por el generador de marca de agua digital para verificar si los umbrales se han cumplido. De no ser

10 así, modifica las amplitudes y(i, j) de conformidad.

[0057] Esto concluye el lado del codificador. Las siguientes secciones tratan con las etapas de procesamiento que se llevan a cabo en el receptor (también designado como decodificador de agua digital).

3.3 El Módulo de Análisis 203

15 [0058] El módulo de análisis 203 es la primera etapa (o bloque) del proceso de extracción de marca de agua digital. Su propósito es transformar la señal de audio con marca de agua digital 200a de regreso a Nf corrientes de

bit (también designada con 204), uno por cada sub-banda espectral i. Estas son adicionalmente procesados por el módulo de sincronización 201 y el extractor de marca de agua digital 202, como se discute en las Secciones

3.4 y 3.5, respectivamente. Hay que notar que

son corrientes de bits suaves, es decir pueden tomar, por 20 ejemplo cualquier valor real y sin haber tomado una decisión dura en el bit.

[0059] El módulo de análisis consiste de tres partes que se ilustran en la Figura 16: El banco de filtros de análisis 1600, el bloque de normalización de amplitud 1604 y la descodificación diferencial 1608.

3.3.1 Banco de filtros de análisis 1600

25 [0060] La señal de audio de marca de agua digital se transforma en el dominio de tiempo-frecuencia por el banco de filtros de análisis 1600 que se muestra en detalle en la Figura 10a. La alimentación del banco de filtros es la señal de audio con marca de agua digital recibida r(t). Su salida son los coeficientes complejos biAFB (j) para la ramificación i-ésima o sub-banda en el instante de tiempo j. Estos valores contienen información respecto a la amplitud y la fase de la señal en la frecuencia central fi y el tiempo j·Tb.

30 [0061] El banco de filtros 1600 consiste de Nf ramificaciones, una por cada sub-banda espectral i. Cada ramificación se divide en una sub-ramificación superior para el componente en fase y una sub-ramificación inferior para el componente de cuadratura de la sub-banda i. Aunque la modulación en el generador de marca de agua digital y de esta manera la señal de audio de marca de agua digital son puramente evaluación real, el análisis de valor complejo de la señal en el receptor se requiere debido a que rotaciones de la constelación de modulación

35 introducida por el canal y por desalineamientos de sincronización no se conoce en el receptor. A continuación consideramos la ramificación i-ésima del banco de filtros. Al combinar la sub-ramificación en fase y de cuadratura, podemos definir la señal de banda base de valor complejo biAFB(j) como

en donde * indica convolución y giR(t) es la respuesta de impulso del filtro de paso bajo de receptor de sub-banda i. Usualmente giR(t)i(t) es igual a la función de formación de bit de banda base giT(t) de la sub-banda i en el modulador 307 a fin de cumplir con la condición de filtro acoplado, pero igualmente son posibles otras respuestas de impulso.

[0062] A fin de obtener los coeficientes biAFB(j) con la velocidad de l=Tb, la salida continua biAFB(j) debe ser

45 muestreada. Si la sincronización correcta de bits se conoce por el receptor, el muestreado con velocidad 1=Tb será suficiente. Sin embargo, ya que aún no se conoce la sincronización de bits, el muestreado se lleva a cabo con la velocidad de Nos/Tb en donde Nos es el factor de sobre-muestreado de banco de filtros de análisis. Al seleccionar Nos suficientemente grande (e.g. Nos = 4), podemos asegurar que al menos un ciclo de muestreado está suficientemente cerca a la sincronización de bits ideal. La decisión en la mejor capa de sobremuestreado se realiza

50 durante el proceso de sincronización, de manera tal que todos los datos sobremuestreados se mantienen hasta entonces. Este proceso se describe en detalle en la Sección 3.4.

[0063] A la salida de la ramificación i-ésima tenemos los coeficientes biAFB(j,k) en donde j indica el número de bit o el instante de tiempo y k indica la posición de sobremuestreado dentro de este bit sencillo, en donde k = 1 ; 2; Nos.

[0064] La Figura 10b da una vista general ejemplar de la ubicación de los coeficientes en el plano de tiempofrecuencia. El factor de sobremuestreado es Nos = 2. La altura y el ancho de los rectángulos indica respectivamente 5 el ancho de banda y el intervalo de tiempo de la parte de la señal que se representa por el coeficiente correspondiente biAFB(j,k).

[0065] Si las frecuencias de sub-banda fi se eligen como múltiplos de un cierto intervalo Lf, el banco de filtros de análisis puede implementarse eficientemente con la Transformada Fourier Rápida (FFT = Fast Fourier Transform).

10 3.3.2 Normalización de Amplitud 1604

[0066] Sin pérdida de generalidad y para simplificar la descripción, consideramos que se conoce la sincronización de bits y que Nos = 1 a continuación. Esto es, tenemos coeficientes complejos biAFB(j) a la alimentación del bloque de normalización 1604. Ya que no hay disponible información de estado de canal en el receptor (es decir, se desconoce el canal de propagación), se emplea un esquema de combinación de ganancia igual (EGC = equal gain

15 combining). Debido al canal de dispersión de tiempo y frecuencia, la energía del bit enviado bi(j) no solo se encuentra alrededor de la frecuencia central fi y el instante de tiempo j, sino también a frecuencias e instantes de tiempo adyacentes. Por lo tanto, para una ponderación más precisa, se calculan adicionales coeficientes a las frecuencias fj ±n Lf y se utilizan para normalización del coeficiente biAFB(j). Si n = 1 tenemos, por ejemplo,

(11)

[0067] La normalización para n > 1 es una extensión directa de la fórmula anterior. De la misma manera también podemos elegir el normalizar los bits suaves al considerar más de un instante de tiempo. La normalización se lleva a cabo por cada sub-banda i y cada instante de tiempo j. La combinación actual de EGC se realiza en etapas

25 posteriores del proceso de extracción.

3.3.3 Descodificación diferencial 1608

[0068] En la alimentación del bloque de descodificación diferencial 1608 tenemos coeficientes complejos normalizados en amplitud binorm(j) que contiene información respecto a la fase de los componentes de señal a la 30 frecuencia fi y el instante de tiempo j. Ya que los bits se codifican de manera diferencial en el transmisor, la operación inversa debe realizarse aquí. Los bits suaves

se obtienen al primero calcular la diferencia en fase de dos coeficientes consecutivos y después tomar la parte real:

35 (12)

(13)

[0069] Esto debe llevarse a cabo por separado por cada sub-banda debido a que el canal normalmente introduce diferentes rotaciones de fase en cada sub-banda.

3.4 El Módulo de Sincronización 201

[0070] La tarea del módulo de sincronización es encontrar el alineamiento temporal de la marca de agua digital. El problema de sincronizar el descodificador a los datos codificados es doble. En una primer etapa, el banco de filtros de análisis debe ser alineado con los datos codificados, es decir las funciones de conformado de bits giT(t)

empleadas en la síntesis en el modulador deben alinearse con los filtros giR(t) empleados para el análisis. Este problema se ilustra en la Figura 12a, en donde los filtros de análisis son idénticos a los de síntesis. En la parte superior, están visibles tres bits. Por simplicidad, las formas de onda para todos los tres bits no se han ajustado en escala. El desplazamiento temporal entre bits diferentes es Td. La parte inferior ilustra el aspecto de sincronización 5 en el descodificador: el filtro puede ser aplicado en diferentes instantes en tiempo, sin embargo, solo la posición marcada en rojo (curva 1299a) es correcta y permite extraer el primer bit con la mejor proporción de señal a ruido (SNR = signal to noise ratio) y proporción de señal a interferencia (SIR = signal to interference ratio). De hecho, un alineamiento incorrecto llevará a degradación tanto de SNR como SIR. Nos referimos a este primer aspecto de alineamiento como "sincronización de bit". Una vez que la sincronización de bit se ha logrado se pueden extraer en

10 forma óptima bits. Sin embargo, para descodificar correctamente un mensaje, es necesario saber en qué bit empieza un nuevo mensaje. Este aspecto se ilustra en la Figura 12b y se refiere como sincronización de mensaje. En la corriente de bits descodificados solo la posición inicial marcada en rojo (posición 1299b) es correcta y permite descodificar el mensaje k-ésimo.

[0071] Primero atendemos solamente el mensaje de sincronización. La firma de sincronización, como se explica en

15 la Sección 3.1, está compuesta de Ns secuencias en un orden predeterminado que se incrustan en forma continua y periódica en la marca de agua digital. El módulo de sincronización es capaz de recuperar el alineamiento temporal de las secuencias de sincronización. Dependiendo del tamaño Ns podemos distinguir entre dos modos de operación, que se ilustran en las Figuras 12c y 12d, respectivamente.

[0072] En el modo de sincronización de mensaje completo (Figura 12c) tenemos Ns = Nm/Rc. Por simplicidad en la

20 figura consideramos Ns = Nm/Rc = 6 y sin propagación de tiempo, es decir, Nt = 1. La firma de sincronización empleada, para propósitos de ilustración, se muestra por debajo de los mensajes. En realidad, se modulan dependiendo de los bits de código y secuencias de propagación de frecuencia, como se explica en la Sección 3.1. En este modo, la periodicidad de la firma de sincronización es idéntica a la de los mensajes. El módulo de sincronización por lo tanto puede identificar el inicio de cada mensaje al encontrar el alineamiento temporal de la

25 firma de sincronización. Nos referimos a las posiciones temporales en las cuales una nueva firma de sincronización empieza como aciertos de sincronización. Los aciertos de sincronización después se pasan al extractor de marca de agua digital 202.

[0073] El segundo modo posible, el modo de sincronización de mensaje parcial (Figura 12d), se ilustra en la Figura 12d. En este caso tenemos Ns <Nm = Rc. En la figura hemos tomado Ns = 3, de manera tal que las tres secuencias

30 de sincronización se repiten dos veces por cada mensaje. Por favor note que la periodicidad de los mensajes no tiene que ser multiplicada por la periodicidad de la firma de sincronización. En este modo de operación, no todos los aciertos de sincronización corresponden al inicio de un mensaje. El módulo de sincronización no tiene medios para distinguir entre aciertos y esta tarea se da al extractor de marca de agua digital 202.

[0074] Los bloques de procesamiento del módulo de sincronización se ilustran en las Figuras 11a y 11b. El módulo

35 de sincronización lleva a cabo la sincronización de bits y la sincronización de mensaje (ya sea completa o parcial) de inmediato al analizar la salida del correlacionador de firma de sincronización 1201. Los datos en el dominio de tiempo/frecuencia 204 se proporcionan por el módulo de análisis. Ya que la sincronización de bits aún no está disponible, el bloque 203 sobre muestrea los datos con el factor Nos, como se describe en la Sección 3.3. Una ilustración de los datos de alimentación se da en la Figura 12e. Para este ejemplo hemos tomado Nos = 4, Nt = 2, y

40 Ns = 3. En otras palabras, la firma de sincronización consiste de 3 secuencias (denotadas con a, b, y c). La propagación de tiempo, en este caso con secuencia de propagación ct = [1 1] T, simplemente repite cada bits dos veces en el dominio de tiempo. Los aciertos de sincronización exactos se denotan con flechas y corresponden al inicio de cada firma de sincronización. El periodo de la firma de sincronización es Nt · Nos · Ns = NSb, que es 2 · 4 · 3 = 24, por ejemplo. Debido a la periodicidad de la firma de sincronización, el correlacionador de firma de sincronización

45 (1201) divide arbitrariamente el eje de tiempo en bloques, denominados bloques de búsqueda, con tamaño Nsbl, cuyo subíndice representa la longitud de bloque de búsqueda. Cada bloque de búsqueda debe contener (o típicamente contiene) un acierto de sincronización como se ilustra en la Figura 12f. Cada uno de los Nsbl, bits es un acierto de sincronización candidato. La tarea de bloque 1201's es calcular una medida de probabilidad para cada bit candidato de cada bloque. Está información se pasa entonces al bloque 1204 que calcula los aciertos de

50 sincronización.

3.4.1 El correlacionador de firma de sincronización 1201

[0075] Por cada uno de las posiciones de sincronización candidato Nsbl el correlacionador de firma de sincronización calcula una medida de probabilidad, esta última es más grande y más probable es que el

55 alineamiento temporal (tanto de bits como parcial o sincronización de mensaje completa) sea encontrado. Las etapas de procesamiento se ilustran en la Figura 12g.

[0076] De acuerdo con esto, puede obtenerse una secuencia 1201a de valores de probabilidad, asociados con diferentes selecciones de posición.

[0077] El bloque 1301 lleva a cabo la concentración temporal, es decir multiplica cada Nt bits con la secuencia de propagación temporal ct y después los suma. Esto se lleva a cabo por cada uno de las sub-bandas de frecuencia Nf.

5 La Figura 13a muestra un ejemplo. Tomamos los mismos parámetros que se describió en la sección previa, es decir Nos = 4, Nt = 2, y Ns = 3. La posición de sincronización candidato está marcada. De ese bit, con Nos desactivado, Nt · Ns se toman con bloque 1301 y concentran en tiempo con secuencias Ct, de manera tal que quedan los Ns bits.

[0078] En el bloque 1302 los bits son multiplicados por elementos con las secuencias de propagación Ns (ver Figura 13b).

10 [0079] En el bloque 1303 la concentración de frecuencia se lleva a cabo, es decir, cada bit se multiplica con la secuencia de propagación Cf y después suma sobre la frecuencia.

[0080] En este punto, si la posición de sincronización fue la correcta, tendríamos Ns bits descodificados. Ya que los bits no se conocen al receptor, el bloque 1304 calcula la medida de probabilidad al tomar los valores absolutos de los valores Ns y suma.

15 [0081] La salida del bloque 1304 en principio es un correlacionador no coherente que busca la firma de sincronización. De hecho, cuando se elige una Ns pequeña, es decir el modo de sincronización de mensaje parcial, es posible utilizar secuencias de sincronización (por ejemplo a, b, c) que son mutuamente ortogonales. Al hacerlo, cuando el correlacionador no se alinea correctamente con la firma, su salida será muy pequeña, idealmente cero. Cuando se utiliza el modo de sincronización de mensaje completo, se recomienda utilizar las más posibles

20 secuencias de sincronización ortogonal, y después crear una firma para elegir cuidadosamente el orden en el que se emplean. En este caso, la misma teoría puede aplicarse cuando se buscan secuencias de propagación con buenas funciones de auto correlación. Cuando el correlacionador solo se desalinea ligeramente, entonces la salida del correlacionador no será cero incluso en el caso ideal, pero de cualquier forma será más pequeña en comparación con el alineamiento perfecto, ya que los filtros de análisis no pueden capturar en forma óptima la energía de señal.

3.4.2 Cálculo de aciertos de sincronización 1204

[0082] Este bloque analiza la salida del correlacionador de firma de sincronización para decidir dónde están las posiciones de sincronización. Ya que el sistema es substancialmente robusto contra desalineamientos de hasta Tb/4 y la Tb normalmente se toma de alrededor 40 ms, es posible integrar la salida de 1201 con el tiempo para lograr una 30 sincronización más estable. Una implementación posible de esto se da por un filtro IIR aplicado sobre el tiempo con una respuesta de impulso con degradación exponencial. En forma alterna, un filtro promedio con movimiento FIR tradicional puede ser aplicado. Una vez que se ha llevado a cabo el promediado, una segunda correlación sobre diferente Nt·Ns se lleva a cabo ("selección de posición diferente"). De hecho, deseamos explotar la información que la función de auto correlación de la función de sincronización se conoce. Esto corresponde a un estimador de 35 Máxima Probabilidad. La idea se muestra en la Figura 13c. La curva muestra la salida del bloque 1201 después de integración temporal. Una posibilidad para determinar el acierto de sincronización simplemente se ha encontrado el máximo de esta función. En la Figura 13d vemos la misma función (en negro) filtrada con la función de auto correlación de la firma de sincronización. La función resultante se traza en rojo. En este caso el máximo es más pronunciado y nos da la posición del acierto de sincronización. Los dos métodos son substancialmente similares

40 para alto SNR pero el segundo método se realiza y desempeña mucho mejor don menores regímenes de SNR. Una vez que los aciertos de sincronización se han encontrado, se pasan al extractor de marca de agua digital 202 que descodifica los datos.

[0083] En algunas modalidades, a fin de obtener una señal de sincronización robusta, se realiza sincronización en el modo de sincronización de mensaje parcial con cortas firmas de sincronización. Por esta razón, deben realizarse

45 muchas descodificaciones, incrementando el riesgo de detecciones de mensaje falso positivo. Para evitar esto, en algunas modalidades pueden insertarse secuencias de señalización en los mensajes con una menor velocidad de bits como consecuencia.

[0084] Este enfoque es una solución al problema que surge de una firma de sincronización más corta que el mensaje, que ya se atendió en la descripción anterior de la sincronización mejorada. En este caso, el descodificador

50 no sabe cuándo empieza un nuevo mensaje e intenta descodificar a varios puntos de sincronización. Para distinguir entre mensajes legítimos y falsos positivos, en algunas modalidades se emplea una palabra de señalización (es decir la carga útil se sacrifica para incrustar una secuencia de control conocida). En algunas modalidades, se emplea una verificación de plausibilidad (en forma alterna o adicional) para distinguir entre mensajes legítimos y falsos positivos.

3.5 El extractor de marca de agua digital 202

[0085] Las partes que constituyen el extractor de marca de agua digital 202 se ilustran en la Figura 14. Este tiene dos entradas, es decir 204 y 205 de los bloques 203 y 201, respectivamente. El módulo de sincronización 201 (ver Sección 3.4) proporciona sellos fechadores de sincronización, es decir, las posiciones en dominio de tiempo en las

5 cuales empieza un mensaje candidato. Más detalles de este asunto se dan en la Sección 3.4. El bloque de banco de filtros para análisis 203, por otra parte, proporciona los datos en el dominio de tiempo/frecuencia listos para ser descodificados.

[0086] La primera etapa de procesamiento, el bloque de selección de datos 1501, selecciona de la alimentación 204 la parte identificada como mensaje candidato a descodificar. La Figura 15 muestra este procedimiento en forma 10 gráfica. La alimentación 204 consiste de Nf corrientes de valores reales. Ya que el alineamiento de tiempo no se conoce al descodificador a priori, el bloque de análisis 203 lleva a cabo un análisis de frecuencia con una velocidad superior a 1/Tb Hz (sobre muestreado). En la Figura 15 debemos usar un factor de sobre muestreado de 4, es decir, 4 vectores con tamaño Nf x 1 se envían de salida cada Tb segundos. Cuando el bloque de sincronización 201 identifica un mensaje candidato, envía un sello fechador 205 indicando el punto de inicio de un mensaje candidato.

15 El bloque de selección 1501 elige la información requerida para la descodificación, es decir una matriz con tamaño Nf xNm/Rc. Está matriz 1501a se da al bloque 1502 para mayor procesamiento.

[0087] Los bloques 1502, 1503, y 1504 llevan a cabo las mismas operaciones de los bloques 1301, 1302, y 1303 explicadas en la Sección 3.4.

[0088] Una modalidad alterna de la invención consiste en evitar los cálculos realizados en 1502-1504 al permitir

20 que el módulo de sincronización suministre también los datos a descodificar. Conceptualmente es un detalle. Desde el punto de vista de implementación, es solo cuestión de cómo se realizan los amortiguadores. Sin embargo, el volver a hacer los cálculos nos permite tener más pequeños amortiguadores.

[0089] El descodificador de canal 1505 lleva a cabo la operación inversa del bloque 302. Si el codificador de canal, en una modalidad posible de este módulo, consiste de un codificador convolucional junto con un intercalador,

25 entonces el descodificador de canal realizará el desintercalado y la descodificación convolucional, por ejemplo, con el algoritmo de Viterbi bien conocido. A la salida de este bloque tenemos Nm bits, es decir, un mensaje candidato.

[0090] El bloque 1506, bloque de señalización y plausibilidad, decide si el mensaje candidato de entrada es de hecho un mensaje o no. Para realizar esto, son posibles diferentes estrategias.

[0091] La idea básica es utilizar una palabra de señalización (como una secuencia CRC) para distinguir entre

30 mensajes verdaderos y falsos. Esto sin embargo reduce el número de bits disponibles como carga útil. En forma alterna, podemos utilizar verificaciones de plausibilidad. Si los mensajes por ejemplo contienen un sello fechador, mensajes consecutivos deben tener sellos fechadores consecutivos. Si un mensaje descodificado posee un sello fechador que no es del orden correcto, podemos descartarlo.

[0092] Cuando se ha detectado correctamente un mensaje, el sistema puede elegir aplicar los mecanismos de

35 vista preliminar y/o vista hacia atrás. Consideramos que tanto sincronización de mensaje como de bit se ha logrado. Considerando que el usuario no está saltando (zapeo), el sistema “ve hacia atrás” en tiempo e intenta descodificar los mensajes pasados (si no están ya descodificado) utilizando el mismo punto de sincronización (enfoque de vista hacia atrás). Esto es particularmente útil cuando se inicia el sistema. Aún más, en malas condiciones, puede ocupar dos mensajes para lograr sincronización. En este caso, el primer mensaje no tiene posibilidad. Con la opción de

40 vista hacia atrás, podemos guardar “buenos” mensajes que no se han recibido sólo debido a sincronización hacia atrás. La vista preliminar es la misma pero trabaja hacia el futuro. Si tenemos un mensaje ahora sabemos dónde deberá estar el siguiente mensaje, y podemos intentar descodificarlo de cualquier forma.

3.6. Detalles de Sincronización

45 [0093] Para la codificación de una carga útil, por ejemplo un algoritmo Viterbi puede emplearse. La Figura 18a muestra una representación gráfica de una carga útil 1810, una secuencia de terminación Viterbi 1820, una carga útil codificada Viterbi 1830 y una versión de código de repetición 1840 de una carga útil codificada Viterbi. Por ejemplo, la longitud de carga útil puede ser de 34 bits y la secuencia de terminación Viterbi puede comprender 6 bits. Si, por ejemplo una velocidad de código Viterbi de 1/7 puede emplearse, la carga útil codificada Viterbi puede comprender

50 (34+6)* 7=280 bits. Además, al utilizar una codificación de repetición de 1/2, la versión codificada de repetición 1840 de la carga útil codificada Viterbi 1830 puede comprender 280*2=560 bits. En este ejemplo, considere un intervalo de tiempo de bit de 42.66 ms, la longitud de mensaje será de 23.9 s. La señal puede incrustarse por ejemplo con 9 sub-portadoras (por ejemplo colocadas de acuerdo con las bandas críticas) de 1.5 a 6 kHz como se indica por el espectro de frecuencia mostrado en la Figura 18b. En forma alterna, también otro número de sub-portadoras (por ejemplo 4, 6, 12, 15 o un número entre 2 y 20) dentro de un intervalo de frecuencia entre 0 y 20 kHz puede ser utilizado.

[0094] La Figura 19 muestra una ilustración esquemática del concepto básico 1900 para la sincronización, también denominada sinc ABC. Muestra una ilustración esquemática de un mensaje no codificado 1910, un mensaje 5 codificado 1920 y una secuencia de sincronización (secuencia sinc) 1930 así como la aplicación de la sinc a varios mensajes 1920 uno después de otro.

[0095] La secuencia de sincronización o secuencia de sinc mencionada en conexión con la explicación de este concepto de sincronización (mostrado en las Figuras 19 - 23) puede ser igual a la firma de sincronización anteriormente mencionada.

10 [0096] Además, la Figura 20 muestra una ilustración esquemática de la sincronización que se encuentra al correlacionar con la secuencia sinc. Si la secuencia de sincronización 1930 es más corta que el mensaje, puede encontrarse más de un punto de sincronización 1940 (o bloque de tiempo de alineamiento) dentro de un solo mensaje. En el ejemplo mostrado en la Figura 20, 4 puntos de sincronización se encuentran dentro de cada mensaje. Por lo tanto, por cada sincronización encontrada, un descodificador Viterbi (una secuencia de

15 descodificación Viterbi) puede iniciarse. De esta manera, por cada punto de sincronización 1940 un mensaje 2110 puede obtenerse, como se indica en la Figura 21.

[0097] Con base en estos mensajes, los mensajes verdaderos 2210 pueden ser identificados mediante una secuencia CRC (secuencia de verificación de redundancia cíclica) y/o una verificación de plausibilidad, como se muestra en la Figura 22.

20 [0098] La detección CRC (detección de verificación de redundancia cíclica) puede emplear una secuencia conocida para identificar mensajes verdaderos de positivos falsos. La Figura 23 muestra un ejemplo para una secuencia CRC agregada al final de una carga útil.

[0099] La probabilidad de falso positivo (un mensaje generado con base en un punto de sincronización erróneo) puede depender de la longitud de la secuencia CRC y el número de descodificadores Viterbi (número de puntos de

25 sincronización dentro de un solo mensaje) iniciado. Para incrementar la longitud de la carga útil sin incrementar la probabilidad de falso positivo, puede explotarse una plausibilidad (prueba de plausibilidad) o la longitud de la secuencia de sincronización (firma de sincronización) puede incrementarse.

4. Conceptos y Ventajas

30 [0100] A continuación, se describirán algunos aspectos del sistema anteriormente discutido, que se consideran innovadores. También, la relación de esos aspectos a las tecnologías del estado-de-la técnica se discutirá.

4.1. Sincronización continua

[0101] Algunas modalidades permiten una sincronización continua. La señal de sincronización, que denotamos

35 una firma de sincronización, se incrusta en forma continua y paralela a los datos por multiplicación con secuencias (también designado como secuencias de propagación de sincronización) conocidas tanto para el lado de transmisión como de recepción.

[0102] Algunos sistemas convencionales utilizan símbolos especiales (diferentes a los utilizados para los datos), mientras que algunas modalidades de acuerdo con la invención no utilizan estos símbolos especiales. Otros

40 métodos clásicos consisten de incrustar una secuencia conocida de bits (preámbulo) multiplexados en tiempo con los datos, o incrustar una señal multiplexada en frecuencia con los datos.

[0103] Sin embargo, se ha encontrado que utilizar sub-bandas dedicadas para sincronización es indeseable, ya que el canal puede tener muescas en esas frecuencias haciendo no confiable la sincronización. En comparación con los otros métodos, en donde un preámbulo o un símbolo especial es multiplexado en tiempo con los datos, el

45 método aquí descrito es más ventajoso como el método aquí descrito permite dar seguimiento a cambios en la sincronización (debido por ejemplo a movimiento) continuamente.

[0104] Además, la energía de la señal de marca de agua digital está sin cambio (por ejemplo por la introducción multiplicativa dla marca de agua digital en la representación de información de propagación) y la sincronización puede diseñarse independiente del modelo psicoacústico y velocidad de datos. La longitud en tiempo de la firma de

50 sincronización, que determina la robustez de la sincronización, puede diseñarse a voluntad completamente independiente de la velocidad de datos.

[0105] Otro método clásico consiste en incrustar un código de secuencia de sincronización multiplexado con los datos. Cuando se compara con este método clásico, la ventaja del método aquí descrito es que la energía de los datos no representa un factor de interferencia en el cálculo de la correlación, proporcionando más robustez. Además, cuando se utiliza multiplexado de código, el número de secuencias ortogonales disponibles para la

5 sincronización se reduce ya que algunos son necesarios para los datos.

[0106] Para resumir, el enfoque de sincronización continua aquí descrito proporciona una gran cantidad de ventajas frente a los conceptos convencionales.

[0107] Sin embargo, en algunas modalidades de acuerdo con la invención, puede aplicar un concepto de sincronización diferente.

4.2. Propagación 2D

[0108] Algunas modalidades del sistema propuesto llevan a cabo propagación tanto en dominio de tiempo como frecuencia, es decir una propagación bidimensional (brevemente designada como propagación 2D). Se ha encontrado que esto es ventajoso respecto a sistemas ID ya que la proporción de bits erróneos puede ser además

15 reducida al agregar redundancia por ejemplo en dominio de tiempo.

[0109] Sin embargo, en algunas modalidades de acuerdo con la invención, puede aplicarse un concepto de propagación diferente.

4.3. Codificación Diferencial y descodificación Diferencial

20 [0110] En algunas modalidades de acuerdo con la invención, una robustez incrementada contra movimiento y desigualdad o incompatibilidad de frecuencia de los osciladores locales (cuando se comparan con sistemas convencionales) se logra por la modulación diferencial. Se ha encontrado que de hecho, el efecto Doppler (movimiento) y desigualdades de frecuencia llevan a una rotación de la constelación BPSK (en otras palabras, una rotación en el plano complejo de los bits). En algunas modalidades, los efectos nocivos de esta rotación de la

25 constelación BPSK (o cualquier otra constelación de modulación apropiada) se evitan al utilizar una codificación diferencial o descodificación diferencial.

[0111] Sin embargo, en algunas modalidades de acuerdo con la invención, puede aplicar un concepto de codificación o concepto de descodificación diferente. También, en algunos casos, la codificación diferencial puede ser omitida.

4.4. Conformado de bits

[0112] En algunas modalidades de acuerdo con la invención, el conformado de bits logra una mejora significante del desempeño del sistema, debido a que la confiabilidad de la detección puede incrementarse utilizando un filtro adaptado al conformado de bits.

35 [0113] De acuerdo con algunas modalidades, el uso del conformado de bits respecto a aplicación de marca de agua digital acarrea mejorada confiabilidad del proceso de aplicación de marca de agua digital. Se ha encontrado que pueden obtenerse resultados particularmente buenos si la función de conformado de bits es más larga que el intervalo de bits.

[0114] Sin embargo, en algunas modalidades de acuerdo con la invención, puede aplicar un concepto de 40 conformado de bit diferente. También, en algunos casos, puede omitirse el conformado de bits.

4.5. Interactivo entre Modelo psicoacústico (PAM) y síntesis de Banco de Filtros (FB)

[0115] En algunas modalidades, el modelo psicoacústico interactúa con el modulador para realizar ajuste fino de las amplitudes que multiplican los bits.

45 [0116] Sin embargo, en algunas otras modalidades, esta interacción puede ser omitida.

4.6. Características de vista preliminar y vista hacia atrás

[0117] En algunas modalidades, se aplican enfoques de “vista hacia atrás” y “vista preliminar”.

[0118] A continuación, estos conceptos se resumirán brevemente. Cuando un mensaje se descodifica correctamente, se considera que se ha logrado la sincronización. Considerando que el usuario no está saltando (zapeo), en algunas modalidades, se realiza una vista hacia atrás en tiempo y se intenta descodificar los mensajes

5 pasados (si no están ya descodificados) utilizando el mismo punto de sincronización (enfoque de vista hacia atrás). Esto es particularmente útil cuando se inicia el sistema.

[0119] En malas condiciones, puede ocupar 2 mensajes para lograr la sincronización. En este caso, el primer mensaje no tiene posibilidad en sistemas convencionales. Con la opción de vista hacia atrás, que se emplea en algunas modalidades de la invención, es posible guardar (o descodificar) mensajes “buenos” que no se han recibido

10 sólo debido a sincronización hacia atrás.

[0120] La vista preliminar es lo mismo pero funciona hacia el futuro. Si tendré un mensaje ahora, sé dónde estará mi siguiente mensaje, y puedo intentar descodificarlo de cualquier forma. De acuerdo con esto, pueden descodificarse mensajes de superposición.

[0121] Sin embargo, en algunas modalidades de acuerdo con la invención, la característica de vista preliminar y/o 15 la característica de vista hacia atrás pueden ser omitidas.

4.7. Incrementada robustez de sincronización

[0122] En algunas modalidades, para obtener una señal de sincronización robusta, se realiza sincronización en modo de sincronización de mensaje parcial con cortas firmas de sincronización. Por esta razón, muchas

20 descodificaciones deben realizarse, incrementando el riesgo de detecciones de mensaje de falso positivo. Para evitar esto, en algunas modalidades, secuencias de señalización pueden insertarse en los mensajes con una menor velocidad de bits como consecuencia.

[0123] Sin embargo, en algunas modalidades de acuerdo con la invención, puede aplicarse un concepto diferente para mejorar la robustez de sincronización. También, en algunos casos, el uso de cualesquiera conceptos para 25 incrementar la robustez de sincronización puede ser omitido.

4.8. Otras mejoras

[0124] A continuación, se presentarán y discutirán algunas otras mejoras en general del sistema anteriormente descrito respecto a la técnica previa:

30 1. Menor complejidad computacional

2.: Mejor calidad de audio debido a mejor modelo psicoacústico

3.: Más robustez en ambientes reverberantes debido a las señales multiportadoras de banda estrecha

4.: Una estimación SNR se evita en algunas modalidades. Esto permite mejor robustez, especialmente en bajos regímenes SNR.

35 [0125] Algunas modalidades de acuerdo con la invención son mejores que los sistemas convencionales, que utilizan anchos de banda muy estrechos por ejemplo de 8 Hz por las siguientes razones:

1.: Anchos de banda de 8 Hz (o un ancho de banda muy estrecho similar) requieren símbolos de muy largo tiempo debido a que el modelo psicoacústico permite muy poca energía para hacerlo inaudible;

2.: 8 Hz (o anchos de banda muy estrechos similares) hacen sensible contra espectros Doppler variante en

40 tiempo. De acuerdo con esto, este sistema de banda estrecha típicamente no es suficientemente bueno, si se implementa por ejemplo en un reloj.

[0126] Algunas modalidades de acuerdo con la invención son mejores que otras tecnologías por las siguientes razones:

1. Técnicas que alimentan un eco fallan completamente en habitaciones reverberantes. En contraste, en 45 algunas modalidades de la invención, se evita la introducción de un eco.

2. Técnicas que utilizan sólo propagación de tiempo tienen una más larga duración de mensaje en comparación con modalidades del sistema anteriormente descrito en donde se emplea una propagación bidimensional, por ejemplo tanto en tiempo como en frecuencia.

[0127] Algunas modalidades de acuerdo con la invención son mejores que el sistema descrito en DE 196 40 814, debido a que una o más de las siguientes desventajas del sistema de acuerdo con el documento se superan:

• la complejidad en el descodificador de acuerdo con DE 196 40 814 es muy alta, se utiliza un filtro de longitud 2N con N = 128.

5 • el sistema de acuerdo con DE 196 40 814 comprende una prolongada duración de mensaje

•: en el sistema de acuerdo con DE 196 40 814, la propagación sólo en el dominio del tiempo con ganancia de propagación relativamente alta (por ejemplo 128)

•: en el sistema de acuerdo con DE 196 40 814 la señal se genera en el dominio de tiempo, transforma al

dominio espectral, pondera, se transforma de regreso a dominio en tiempo y superpone en audio, lo 10 que hace al sistema muy complejo.

5. Aplicaciones

[0128] La invención comprende un método para modificar una señal de audio para ocultar datos digitales y un descodificador correspondiente capaz de recuperar esta información mientras que la calidad percibida de la señal de

15 audio modificada permanece indistinguible a la original.

[0129] Ejemplos de aplicaciones posibles de la invención se dan a continuación:

1. Supervisión de difusión: una información que contiene marca de agua digital por ejemplo en la estación y tiempo se oculta en la señal de audio de programas de radio o televisión. Descodificadores, incorporados en pequeños dispositivos que transportan los sujetos de prueba, son capaces de recuperar la marca de agua

20 digital, y de esta manera recolectar información valiosa para agencias publicitarias, es decir quiénes ven que programa y cuándo.

2. Auditoría: una marca de agua digital puede ocultarse por ejemplo en anuncios. Al supervisar automáticamente las transmisiones de una cierta estación es entonces posible saber cuándo exactamente se difundió el anuncio. De manera similar, es posible recuperar información estadística respecto a los

25 calendarios de programación de diferentes radios, por ejemplo qué tan a menudo se presenta una pieza de música, etc.

3. Incrustación de metadatos: el método propuesto puede emplearse para ocultar información digital respecto al programa o pieza de música, por ejemplo nombre y autor de la pieza o duración del programa, etc.

[0130] Resumiendo las modalidades anteriores y comparando las modalidades de las Figuras 1 a 23 con las

30 modalidades de la Figura 24 y 25, estas modalidades describen un proveedor de señal de marca de agua digital 2400 para proporcionar una señal de marca de agua digital 2440; 101b adecuado para ocultarse en una señal de audio 2430; 106 cuando la señal de marca de agua digital se agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca de agua digital 2450; 101a, el proveedor de señal de marca de agua digital comprende un procesador psicoacústico 2410; 102 para determinar un umbral de enmascarado de la

35 señal de audio; y un modulador 2420; 307 en 101 para generar la señal de marca de agua digital a partir de una superposición como se representa por la ecuación 8 e ilustra en la Figura 12a, por ejemplo de funciones de conformado de muestra giT(t) espaciadas entre sí a un intervalo de tiempo de muestra Tb de una representación discreta en tiempo bdiff (i, j) de los datos dla marca de agua digital, es decir los paquetes anteriormente mencionados de igual longitud Mp, cada función de conformado de muestra giT(t) se pondera en amplitud con una muestra

40 respectiva bdiff (i, j) de la representación discreta en tiempo, multiplicado por una ponderación de amplitud respectiva γ (i; j) dependiendo del umbral de enmascarado, el modulador se configura de manera tal que el intervalo de tiempo de muestra Tb es más corto que una extensión de tiempo de las funciones de conformado de muestra como se ilustra en forma ejemplar en la Figura 12a; y la ponderación de amplitud respectiva γ (i; j) también depende de

muestras de la representación discreta en tiempo vecina a la muestra respectiva en tiempo.

45 [0131] En particular, el procesador psicoacústico puede ser configurado para determinar el umbral de enmascarado independiente de los datos de marca de agua digital 2450 y el modulador puede configurarse para generar la señal de marca de agua digital en forma iterativa al determinar en forma preliminar una ponderación de amplitud preliminar γ (i; j) con base en el umbral de enmascarado independiente de los datos de marca de agua

digital, y después verificar si la superposición de las funciones de conformado de muestra utilizando la ponderación

50 de amplitud preliminar como la ponderación de amplitud respectiva, viola el umbral de enmascarado. Se ser así, entonces la ponderación de amplitud preliminar se varía para obtener una superposición de las funciones de conformado de muestra utilizando la ponderación de amplitud variada como la ponderación de amplitud respectiva.

Como ya se estableció anteriormente, ya que en la verificación las muestras vecinas de la representación discreta en tiempo influencian/interfieren entre sí debido a la superposición y la extensión de tiempo de las funciones de conformado de muestra que exceden el intervalo de tiempo de muestra, todo el proceso iterativo para generar la señal de marca de agua digital 2440 y las ponderaciones en amplitud finalmente empleadas, respectivamente, 5 dependen de estas muestras vecinas de la representación de datos de marca de agua digital. En otras palabras, la

verificación induce una dependencia de las ponderaciones de amplitud finalmente empleadas γ (i; j) a partir de las muestras bdiff (i, j±1) y permiten una buena compensación entre la capacidad de extracción de marca de agua digital y la incapacidad audible de la señal de marca de agua digital. Por supuesto, el procedimiento de verificar, hacer superposición y variar puede repetirse en forma iterativa.

10 [0132] La dependencia recién mencionada en las muestras vecinas de representación de datos de marca de agua digital puede en forma alterna, ser implementada por el ajuste no iterativo de las ponderaciones de amplitud. Por ejemplo, el modulador puede determinar en forma analítica las ponderaciones de amplitud γ (i; j) con base tanto en

el umbral de enmascarado en (i,j) así como en las muestras de marca de agua digital vecinas bdiff (i, j±1).

[0133] Un propagador de tiempo 305 puede emplearse para propagar los datos de marca de agua digital en tiempo

15 a fin de obtener la representación discreta en tiempo. Además, un propagador de frecuencia 303 puede emplearse para propagar los datos de marca de agua digital en un dominio de frecuencia a fin de obtener la representación discreta en tiempo. Un analizador de tiempo/frecuencia 501 puede emplearse para transferir la señal de audio del dominio de tiempo a un dominio de frecuencia mediante una transformada superpuesta utilizando una primer longitud de ventana con aproximadamente el intervalo de tiempo de muestra. El analizador de tiempo/frecuencia

20 puede configurarse para transferir la señal de audio a partir del dominio de tiempo al dominio de frecuencia mediante la transformada superpuesta también utilizando una segunda longitud de ventana que es más corta que la primera longitud de ventana.

[0134] Cuando la representación discreta de tiempo está compuesta por sub-bandas discretas en tiempo, el modulador puede configurarse para generar la señal de marca de agua digital a partir, por cada sub-banda discreta 25 en tiempo, de una superposición de acuerdo tanto con las ecuaciones 8 como 9 de las funciones de conformado de muestra espaciadas en el intervalo de tiempo de muestra con cada función de conformado de muestra que se pondera en amplitud con una muestra respectiva de las sub-bandas discretas en tiempo respectivas multiplicada por una ponderación de amplitud respectiva dependiendo del umbral de enmascarado, las funciones de conformado de muestra giT(t) de la superposición para una sub-banda discreta en tiempo respectiva, comprenden una frecuencia

30 portadora en una frecuencia central fi de la sub-banda discreta en tiempo respectiva i.

[0135] Además, las modalidades anteriores describen un dispositivo incrustador de marca de agua digital 2500; 100 que comprende un proveedor de señal de marca de agua digital 2400 y un sumador 2510 para agregar la señal de marca de agua digital y la señal de audio para obtener una señal de audio con marca de agua digital.

35 6. Alternativas de Implementación

[0136] Aunque algunos aspectos se han descrito en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, en donde un bloque o dispositivo corresponde a una etapa de método o una característica de una etapa de método. En forma análoga, aspectos descritos en el contexto de una etapa de método también representan una descripción de un bloque o ítem o característica

40 correspondiente de un aparato correspondiente. Algunas o todas las etapas de método pueden ser ejecutadas por (o utilizando) un aparato de equipo físico, por ejemplo un microprocesador, una computadora programable o un circuito electrónico). En algunas modalidades, algunas o más de las etapas de método más importantes pueden ser ejecutadas por este aparato.

[0137] La señal de sello o marca de agua digital codificada de la invención, o una señal de audio en la cual se

45 incrusta la señal de marca de agua digital, puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmisión tal como un medio de transmisión inalámbrica o un medio de transmisión cableada tal como Internet.

[0138] Dependiendo de ciertos requerimientos de implementación, modalidades de la invención pueden implementarse en equipo físico o en soporte lógico. La implementación puede realizarse utilizando un medio de

50 almacenamiento digital, por ejemplo un disco flexible, un DVD, un disco Blue-Ray, un CD, un ROM, un PROM, un EPROM, un EEPROM o una memoria FLASH, que tiene señales de control legibles electrónicamente ahí almacenadas, que cooperan (o son capaces de cooperar) con un sistema de computadora programable tal que se realice el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por computadora.

[0139] Algunas modalidades de acuerdo con la invención comprenden un portador de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema de computadora programable, tal que se realice uno de los métodos aquí descritos.

[0140] En general, modalidades de la presente invención pueden ser implementadas como un producto de

5 programa de computadora con un código de programa, el código de programa es operativo para realizar uno de los métodos cuando el producto de programa de computadora se ejecuta en una computadora. El código del programa puede por ejemplo ser almacenado en un portador transportador legible por máquina.

[0141] Otras modalidades comprenden el programa de computadora para realizar uno de los métodos aquí descritos, almacenado en un portador legible por máquina.

10 [0142] En otras palabras, una modalidad del método de la invención por lo tanto es un programa de computadora que tiene un código de programa para realizar uno de los métodos aquí descritos cuando el programa de computadora se ejecuta en una computadora.

[0143] Una modalidad adicional de los métodos de la invención por lo tanto es un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, ahí grabado, el programa de

15 computadora para realizar uno de los métodos aquí descritos.

[0144] Una modalidad adicional del método de la invención es por lo tanto una corriente de datos o una secuencia de señales que representan el programa de computadora para realizar uno de los métodos aquí descritos. La corriente de datos o la secuencia de señales puede ser por ejemplo configurada para ser transferida mediante una conexión de comunicación de datos, por ejemplo por Internet.

20 [0145] Una modalidad adicional comprende medios de procesamiento, por ejemplo una computadora o un dispositivo lógico programable, configurado para o adaptado para realizar o ejecutar uno de los métodos aquí descritos.

[0146] Una modalidad adicional comprende una computadora que tiene instalado ahí el programa de computadora para realizar uno de los métodos aquí descritos.

25 [0147] En algunas modalidades, un dispositivo lógico programable (por ejemplo matriz de puerta de campo programable in situ (field programmable gate array)) puede emplearse para realizar algunas o todas las funcionalidades de los métodos aquí descritos. En algunas modalidades, una matriz de puerta de campo programable (field programmable gate array) puede cooperar con un microprocesador a fin de realizar uno de los métodos aquí descritos. En general, los métodos de preferencia se realizan por cualquier aparato de equipo físico.

30 [0148] Las modalidades anteriormente descritas son solamente ilustrativas para los principios de la presente invención. Se entiende que modificaciones y variaciones de los arreglos y detalles aquí descritos, serán aparentes a otros con destreza en la especialidad. Es la intención por lo tanto, que esté limitada por el alcance de las reivindicaciones pendientes y no por detalles específicos mostrados a manera de descripción y explicación de las presentes modalidades.

Claims

REIVINDICACIONES

1. Un proveedor de señal de marca de agua digital (2400) para suministrar una señal de marca de agua digital (2440; 101b) adecuada para ocultarse en una señal de audio (2430; 106) cuando la señal de marca de agua digital

5 se agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca de agua digital (2450; 101a), el proveedor de señal de marca de agua digital comprende:

un procesador psicoacústico (2410; 102) para determinar un umbral de enmascarado de la señal de audio; y un modulador (2420; 307) para generar la señal de marca de agua digital a partir de una superposición de funciones de conformado de muestra espaciadas entre sí a un intervalo de tiempo (Tb) de muestra de una

10 representación discreta en tiempo de los datos de marca de agua digital, cada función de conformado de muestra se pondera en amplitud con una muestra respectiva de una representación discreta en tiempo, multiplicado por una ponderación de amplitud respectiva dependiente del umbral de enmascarado, el modulador se configura de manera tal que el intervalo de tiempo de muestra es más corto que una extensión de tiempo de las funciones de conformado

15 de muestra; y la ponderación de amplitud respectiva también depende de las muestras de la representación discreta en tiempo vecinas a la muestra respectiva en tiempo.
2. Proveedor de señal de marca de agua digital de conformidad con la reivindicación 1, en el que el procesador

20 psicoacústico se configura para determinar el umbral de enmascarado independiente de los datos de marca de agua digital y el modulador se configura para generar iterativamente la señal de marca de agua digital al determinar en forma preliminar una ponderación de amplitud preliminar con base en el umbral de enmascarado independiente de los datos de marca de agua digital; verificar si una superposición de las funciones de conformado de muestra utilizando la ponderación de amplitud preliminar como la ponderación de amplitud respectiva, viola el umbral de

25 enmascarado; y si la superposición de las funciones de conformado de muestra utilizando la ponderación de amplitud preliminar como la ponderación de amplitud respectiva, viola el umbral de enmascarado, variar la ponderación de amplitud preliminar para obtener una superposición de las funciones de conformado de muestra utilizando la ponderación de amplitud variada como la ponderación de amplitud respectiva.

30 3. Proveedor de señal de marca de agua digital de conformidad con la reivindicación 1 ó 2, que además comprende un propagador de tiempo (305), para propagar los datos de marca de agua digital en tiempo a fin de obtener la representación discreta en tiempo.
4. Proveedor de señal de marca de agua digital de conformidad con cualquiera de las reivindicaciones 1 a 3, que

35 además comprende un propagador de frecuencia (303), para propagar los datos de marca de agua digital en un dominio de frecuencia a fin de obtener la representación discreta en tiempo.
5. Proveedor de señal de marca de agua digital de conformidad con cualquiera de las reivindicaciones precedentes, en el que el procesador psicoacústico comprende un analizador de tiempo/frecuencia (501) que transfiere la señal

40 de audio desde el dominio de tiempo a un dominio de frecuencia mediante una transformada superpuesta utilizando una primer longitud de ventana de aproximadamente el mismo intervalo de tiempo.
6. Proveedor de señal de marca de agua digital de conformidad con la reivindicación 5, en el que el analizador de tiempo/frecuencia se configura para transferir la señal de audio del dominio de tiempo al dominio de frecuencia

45 mediante la función traslapada también utilizando una segunda longitud de ventana que es más corta que la primer longitud de ventana.
7. Proveedor de señal de marca de agua digital de conformidad con cualquiera de las reivindicaciones precedentes, en el que la representación discreta en tiempo está compuesta por sub-bandas discretas en tiempo, en donde el

50 modulador se configura para generar la señal de marca de agua digital a partir de, para cada sub-banda discreta en tiempo, de una superposición de funciones de conformado de muestra espaciadas en el intervalo de tiempo de muestra con cada función de conformado de muestra que es ponderada en amplitud con una muestra respectiva de la sub-banda discreta en tiempo respectiva, multiplicada por una ponderación de amplitud respectiva dependiendo del umbral de enmascarado, las funciones de conformado de muestra de la superposición para una sub-banda discreta en tiempo respectiva comprenden una frecuencia portadora en una frecuencia central de la sub-banda

5 discreta en tiempo respectivas.
8. Incrustador de marca de agua digital, que comprende:

un proveedor de señal de marca de agua digital para proporcionar una señal de sello digital adecuada para ocultarse en una señal de audio, cuando la señal de marca de agua digital se agrega a la señal de audio, de

10 manera tal que la señal de marca de agua digital representa datos de marca de agua digital, de acuerdo con cualquiera de las reivindicaciones precedentes, y un sumador para agregar la señal de marca de agua digital y la señal de audio para obtener una señal de audio con marca de agua digital.

15 9. Método para proporcionar una señal de marca de agua digital (101b) adecuada para ocultarse en una señal de audio (106), cuando la señal de marca de agua digital se agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca de agua digital (101a), el método comprende:

determinar un umbral de enmascarado de la señal de audio; y generar la señal de marca de agua digital a partir de una superposición de funciones de conformado de

20 muestra espaciadas entre sí a un intervalo de tiempo (Tb) de muestra de la representación discreta en tiempo de los datos de marca de agua digital, cada función de conformado de muestra se pondera en amplitud con una muestra respectiva de la representación discreta en tiempo, multiplicado por una ponderación de amplitud respectiva dependiendo del umbral de enmascarado, la generación se realiza de manera tal que el intervalo de tiempo de muestra es más corto que la extensión de tiempo de las funciones de conformado de

25 muestra; y la ponderación de amplitud respectiva también depende de muestras de la representación discreta en tiempo vecinas a la muestra respectiva en tiempo.
10. Método de incrustación de marca de agua digital, que comprende:

30 proporcionar una señal de marca de agua digital adecuada para ocultarse en una señal de audio cuando la señal de marca de agua digital se agrega a la señal de audio, de manera tal que la señal de marca de agua digital representa datos de marca de agua digital, de acuerdo con la reivindicación 9, y agregar la señal de marca de agua digital y la señal de audio para obtener una señal de audio con marca de agua digital.
11. Programa de computadora que tiene instrucciones almacenadas adaptadas para desempeñar, cuando se ejecuta en una computadora, un método de acuerdo con la reivindicación 9 ó 10.