ES2255626T3 - Insertar datos complementarios en una señal de informacion. - Google Patents

Insertar datos complementarios en una señal de informacion.

Info

Publication number
ES2255626T3
ES2255626T3 ES02777654T ES02777654T ES2255626T3 ES 2255626 T3 ES2255626 T3 ES 2255626T3 ES 02777654 T ES02777654 T ES 02777654T ES 02777654 T ES02777654 T ES 02777654T ES 2255626 T3 ES2255626 T3 ES 2255626T3
Authority
ES
Spain
Prior art keywords
signal
complementary data
delay
property
delayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02777654T
Other languages
English (en)
Inventor
Minne Van Der Veen
Alphons A. M. L. Bruekers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2255626T3 publication Critical patent/ES2255626T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Traffic Control Systems (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

Método de regulación de una señal (ma(n)) de datos complementarios a insertar en una señal (x(n)) de información, comprendiendo el método las etapas de: - determinar una magnitud (g(n)) relativa de una primera propiedad (MX(n)) de la señal de información promediada sobre una región de un tamaño (N) predeterminado y una segunda propiedad (Mma(n)) de la señal de datos complementarios promediada sobre dicha región; - regular la señal de datos complementarios según la magnitud relativa determinada, caracterizado porque la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende las etapas de: - retardar (605) la señal de datos complementarios por un retardo correspondiente al tamaño de la región, lo que resulta en una señal retardada; - regular (604) la señal retardada según la razón determinada, lo que resulta en una primera señal regulada retardada; - regular (603) la señal de datos complementarios según la razón determinada, lo que resulta en una señal regulada; - retardar (606) la señal regulada por un retardo correspondiente al tamaño de la región, lo que resulta en una segunda señal regulada retardada; y - combinar (607) las primera y segunda señales reguladas retardadas.

Description

Insertar datos complementarios en una señal de información.
Esta invención se refiere a un método de regulación de una señal (ma(n)) de datos complementarios a insertar en una señal (x(n)) de información, comprendiendo el método las etapas de:
- determinar una magnitud (g(n)) relativa de una primera función (M_{X}(n)) de propiedad de la señal de información promediada sobre una región de un tamaño (N) predeterminado y una segunda propiedad (M_{ma}(n)) de la señal de datos complementarios promediada sobre dicha región;
- regular la señal de datos complementarios según la magnitud relativa determinada.
La invención también se refiere a una disposición para aplicar tal método.
Tal método y tal aparato se dan a conocer en el documento US-A-5.940.429.
En los últimos años, una tendencia creciente hacia el uso y la distribución de datos multimedia digitales ha dado lugar a una mayor necesidad de protección contra copias, protección de copyright y verificación de la propiedad de tales datos adecuadas.
Las marcas de agua digitales son una tecnología emergente que puede usarse para una variedad de fines, tales como la prueba de propiedad del copyright, el rastreo de copias ilegales, el control de equipos de control de copias, la monitorización de emisiones, la verificación de autenticidad, la adición de información auxiliar en señales multime-
dia, etc.
Una marca de agua comprende datos complementarios que se insertan en una señal original modificando levemente muestras de la señal. Preferiblemente, debería diseñarse un esquema de marcas de agua de manera que la marca de agua sea imperceptible, es decir, que no afecte significativamente la calidad de la señal de información.
En el campo de marcas de agua de señales de audio, se conoce un número de algoritmos de inserción. Por ejemplo, en los algoritmos basados en transformaciones, los coeficientes de una señal de audio digital se transforman de un dominio del tiempo a un dominio de la frecuencia, los coeficientes de la señal transformada se modifican correspondiendo a una señal de datos complementarios y los coeficientes modificados se transforman de nuevo al dominio del tiempo. Un problema general de los enfoques conocidos es su falta de resolución en el dominio del tiempo. Por consiguiente, la señal de datos complementarios puede extenderse en el tiempo y puede introducir distorsiones perceptibles.
En "Robust audio watermarking using perceptual masking", por M.D. Swanson y colaboradores (Signal Processing 66 (1998) 337-355), se da a conocer un método en el que se calcula una función de ganancia temporal modelando la envolvente de la señal de audio portadora. La envolvente estimada de la señal de audio aumenta con la señal de audio y decae exponencialmente. La envolvente estimada se multiplica por la señal de datos complementarios antes de su inserción, conformando así la señal de datos complementarios de un segmento de audio.
Sin embargo, este método de la técnica anterior supone el problema de que puede resultar en una reducción innecesaria de la energía de los datos insertados.
El método descrito en el documento US-A-5.940.429 solventa este problema regulando el nivel de la señal de datos complementarios según las variaciones en el nivel de la señal de información para que se mantenga una razón predeterminada entre estos niveles.
La invención, tal como se reivindica en la reivindicación 1, busca mejorar los métodos conocidos suprimiendo la aparición de los denominados pre-ecos y post-ecos de la señal de datos complementarios, lo que puede reducir significativamente la calidad de la señal de información tal como la percibe el oído humano.
El problema anterior se solventa mediante un método de regulación de una señal de datos complementarios del tipo anteriormente mencionado, caracterizado porque la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende las etapas de:
- retardar la señal de datos complementarios por un retardo correspondiente al tamaño de la región, lo que resulta en una señal retardada;
- regular la señal retardada según la razón determinada, lo que resulta en una primera señal regulada retardada;
- regular la señal de datos complementarios según la razón determinada, lo que resulta en una señal regulada;
- retardar la señal regulada por un retardo correspondiente al tamaño de la región, lo que resulta en una segunda señal regulada retardada; y
- combinar las primera y segunda señal reguladas retardadas.
Según una realización preferida de la invención, la primera propiedad es una función de la energía local de la señal de información y la segunda propiedad es una función de la energía local de la señal de datos complementarios. Por consiguiente, las energías locales de la señal de audio y de la señal de datos complementarios se calculan y comparan directamente. La señal de datos complementarios se atenúa donde su energía accede a la energía de la señal de información y se amplifica en las demás partes. Por tanto, puede insertarse un gran nivel de energía de marca de agua, resultando así en un rendimiento mejorado en términos de resultados de detección frente a la calidad de percepción.
Cuando la primera propiedad es una magnitud local de la señal de información y la segunda función de propiedad es una magnitud local de la señal de datos complementarios, se logra un método computacionalmente económico de regulación de la señal de datos complementarios que evita operaciones computacionalmente caras tales como elevar al cuadrado y calcular una raíz cuadrada.
En algunos casos, la magnitud relativa determinada puede tener un comportamiento no deseado, por ejemplo, puede volverse muy grande, puede estar cambiando rápidamente de amplitud, etc.
Cuando la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende además la etapa de limitar la amplitud de la magnitud relativa a un valor máximo predeterminado, se evita una intensa amplificación no deseada de la señal de datos complementarios.
Cuando la etapa de regular la señal de datos complementarios comprende la etapa de aplicar un filtro paso bajo a la magnitud relativa determinada, se reducen los cambios rápidos en amplitud.
En otra realización preferida más de la invención, la etapa de determinar una magnitud relativa comprende además las etapas de:
- calcular una tercera función de propiedad;
- retardar la tercera función de propiedad para obtener una función de propiedad retardada; y
- combinar la tercera función de propiedad con la función de propiedad retardada para obtener la segunda función de propiedad.
Por consiguiente, se consigue una supresión mejorada adicional de aquellos efectos que son provocados por el retardo de cambios en la magnitud relativa de las funciones de propiedad promediadas en comparación con las señales, en particular en regiones transitorias en las que la señal de información cambia rápidamente.
La invención se refiere además a una disposición del tipo anteriormente mencionado, caracterizada por:
- un medio para retardar la señal de datos complementarios por un retardo correspondiente al tamaño de la región, lo que resulta en una señal retardada;
- un medio para regular la señal retardada según la razón determinada, lo que resulta en una primera señal regulada retardada;
- un medio para regular la señal de datos complementarios según la razón determinada, lo que resulta en una señal regulada;
- un medio para retardar la señal regulada por un retardo correspondiente al tamaño de la región, lo que resulta en una segunda señal regulada retardada; y
- un medio para combinar las primera y segunda señales reguladas retardadas.
La invención se refiere además a un dispositivo para insertar una señal de datos complementarios en una señal de información, comprendiendo el dispositivo una disposición del tipo anteriormente mencionado.
La invención se refiere además a una señal de información que tiene insertada en la misma una señal de datos complementarios, en la que la señal de datos complementarios se ha regulado mediante el método de la invención.
La señal de información puede plasmarse como una señal de comunicación en una red de comunicación, tal como una intranet, una extranet, Internet, una red de área local, una red inalámbrica o cableada, etc.
La señal de información puede almacenarse además en un soporte de grabación. El término soporte de grabación puede incluir cintas magnéticas, discos ópticos, discos de vídeo digital (DVD), discos compactos (CD o CD-ROM), minidiscos, discos duros, disquetes, memorias ferroeléctricas, memorias de sólo lectura programables y que pueden borrarse eléctricamente (EEPROM), memorias flash, EPROM, memorias de sólo lectura (ROM), memorias estáticas de acceso aleatorio (SRAM), memorias dinámicas de acceso aleatorio (DRAM), memorias dinámicas sincrónicas de acceso aleatorio (SDRAM), memorias ferromagnéticas, almacenamientos ópticos, dispositivos de carga acoplada, tarjetas inteligentes, tarjetas PCMCIA, etc.
Estos y otros aspectos de la invención resultarán evidentes a partir de, y se dilucidarán con referencia a, las realizaciones y con referencia a los dibujos, en los que:
La figura 1 muestra una vista esquemática de una disposición para insertar una marca de agua en una señal de información según una realización de la invención;
las figuras 2a-b ilustran el efecto de las distorsiones de pre-eco y post-eco en relación con una señal de datos complementarios insertada en una señal de audio portadora con cambios de amplitud fuertes y súbitos;
la figura 3 muestra un diagrama de flujo de un método según una realización de la invención;
la figura 4 muestra un diagrama esquemático de una disposición de regulación de una señal de datos complementarios según una realización de la invención;
las figuras 5a-d ilustran la influencia del retardo de la señal de datos complementarios según una realización de la invención;
la figura 6 muestra un diagrama esquemático de una disposición de regulación de una señal de datos complementarios según otra realización de la invención; y
las figuras 7a-b ilustran dos realizaciones de disposiciones para implementar la función E(n) de filtrado según la invención.
La figura 1 muestra una vista esquemática de una disposición para insertar una marca de agua en una señal de información según una realización de la invención. La disposición comprende unos circuitos 101 adaptados para segmentar la señal x(n) de audio portadora en unas tramas x_{i}(n) y unos circuitos 102 adaptados para transformar las tramas al dominio de Fourier, lo que tiene como resultado unos coeficientes X_{i}(k) de Fourier, por ejemplo, aplicando una Transformada Rápida de Fourier (FFT). La disposición comprende además un circuito 103 multiplicador adaptado para modificar levemente los coeficientes X_{i}(k) de Fourier de cada trama según una secuencia M(k) de marca de agua, produciendo las muestras X_{i}(k)\cdotM(k) de marca de agua. La secuencia M(k) de marca de agua puede ser una secuencia pseudoaleatoria, por ejemplo, una secuencia pseudoaleatoria normalmente distribuida con una media de cero y una desviación estándar de 1. La disposición comprende además unos circuitos 104 adaptados para transformar las muestras Xi(k)\cdotM(k) de marca de agua al dominio temporal, por ejemplo, aplicando una Transformada Rápida de Fourier Inversa (IFFT). Posteriormente, los segmentos de marca de agua son concatenados por unos circuitos 105 para obtener una señal ma(n) de marca de agua que es multiplicada con una intensidad i global de inserción por el circuito 106 multiplicador. La disposición comprende además unos circuitos 107 adaptados para calcular una función g(n) de ganancia temporal que es multiplicada con señal i\cdotma(n) de marca de agua ajustada a escala por el multiplicador 108. Por último, la señal i\cdotg(n)\cdotma(n) es sumada a la señal x(n) de audio portadora por el sumador 109, lo que resulta en la señal y(n) = x(n) + i\cdotg(n)\cdotma(n) de audio de marca de agua.
Se observa que la multiplicación en el dominio de la frecuencia, M(k)\cdotX_{i}(k) corresponde a una convolución cíclica en el dominio del tiempo. Por tanto, la señal de marca de agua en cualquier trama i dada puede expresarse como
ma_{i}(n) = m(n)\otimesx_{i}(n), donde m(n) es una señal de marca de agua correspondiente en el dominio temporal.
Sin embargo, durante la etapa de transformar una trama de marca de agua de vuelta al dominio temporal por parte de los circuitos 104, la energía de la marca de agua puede extenderse por toda la trama. Este efecto puede provocar distorsiones perceptibles, en particular en presencia de cambios de amplitud fuertes y súbitos, tal como se ilustrará en relación con las figuras 2a-b. Al multiplicar la señal de marca de agua con una función g(n) de ganancia adecuadamente escogida, pueden mejorarse las características temporales de la marca de agua de audio. Más abajo se describirá un método de cálculo de tal función de ganancia según la invención.
Se entiende que pueden emplearse otros tipos de transformaciones matemáticas en vez de una Transformada Rápida de Fourier. Unos ejemplos de tales transformaciones incluyen las Transformadas Discretas de Fourier (DFT), las Transformadas Discretas de Coseno (DCT), las transformadas wavelet, etc.
Se entiende además que pueden utilizarse otros esquemas de inserción. Por ejemplo, puede usarse un filtro FIR de marcas de agua que calcula una convolución lineal para calcular señales de audio con marca de agua. En contraposición a los algoritmos basados en transformadas, el cálculo de una convolución lineal no comprende una segmentación de la señal x(n) portadora. Según esta realización, la señal de audio con marca de agua se calcula según la ecuación y(n) =
x(n) + i\cdotg(n)\cdotx(n)\odotm(n), donde el símbolo \odot denota una convolución lineal, es decir, x(n)\odotm(n) = \Sigma_{m}x(m)m(n - m).
De manera parecida a los algoritmos basados en transformadas tales como el descrito anteriormente, un enfoque de inserción basado en una convolución lineal puede adolecer de una resolución temporal limitada y de distorsiones perceptibles.
Las figuras 2a-b ilustran el efecto de las distorsiones de pre-eco y de post-eco en relación con una señal de datos complementarios insertada en una señal de audio portadora con cambios de amplitud fuertes y súbitos. La figura 2a ilustra un ejemplo de una señal de audio portadora en la que la amplitud A normalizada está trazada como una función del tiempo t. En el ejemplo de la figura 2a, la señal de audio representa un segmento corto de un extracto de audio con castañuelas que comprende unos cambios 201 y 202 de amplitud fuertes y súbitos. También se refiere a tales cambios de amplitud como "ataques" o "transitorios".
La figura 2b ilustra una señal de marca de agua calculada a partir de una señal portadora en la figura 2a según el método descrito en relación con la figura 1 pero sin el uso de una función de ganancia temporal. Tal como puede observase a partir de la figura 2b, en torno a las ubicaciones 207 y 208 de los ataques 201 y 202, respectivamente, la señal de marca de agua está corrida a lo largo de una anchura correspondiente a una trama de análisis. La anchura de una ventana de análisis viene indicada por las líneas 209-210 horizontales para la ubicación 207 de ataque y 211-212 para la ubicación 208 de ataque, respectivamente. La figura 2b ilustra además que las distorsiones se introducen tanto antes de las ubicaciones de ataque, es decir, en las regiones 203 y 205, respectivamente, como tras las ubicaciones de ataque, es decir, en las regiones 201 y 212, respectivamente. Estas distorsiones pueden dar lugar a distorsiones de pre-eco y de post-eco perceptibles, respectivamente. Por tanto, puede observarse a partir de las figuras 2a-b que las distorsiones de percepción introducidas por la señal de marca de agua son particularmente pronunciadas en presencia de ataques.
Una ventaja de la invención es que proporciona un método rápido y computacionalmente barato de eliminar distorsiones de percepción en relación con cambios de amplitud fuertes y súbitos sin necesidad de determinar las ubicaciones de tales cambios. Por consiguiente, se reducen las posibles distorsiones provocadas por un fallo de detección de un ataque.
La figura 3 muestra un diagrama de flujo de un método que calcula una función de ganancia temporal para regular una señal de marca de agua según una realización de la invención. Según esta realización, se supone que una señal
ma(n) de marca de agua en el dominio del tiempo se ha métodos descritos en relación con la figura 1. En una etapa 301 se calcula una energía de movimiento de la señal de datos complementarios según
M_{ma}(n)=\frac{1}{N}\sum\limits_{m \geq 0}ma^{2}(n)E(n-m).
Aquí, E(n) es una función de ventana rectangular con una amplitud 1 y una longitud N, es decir, E(n) = 1, para
0 \leq n \leq N, y E(n) = 0 en las demás partes. Preferiblemente, N se escoge que sea considerablemente inferior a la longitud de las tramas en el esquema de inserción basado en tramas o al tamaño del filtro en un esquema basado en filtros FIR, tal como se ha descrito en relación con la figura 1. Si N se elige muy pequeña, la función de ganancia fluctuará considerablemente, induciendo así un ruido en la señal. Si N se elige grande, es decir, del orden de la longitud de trama, la función de ganancia temporal sólo variará lentamente, reduciendo así la eficacia de supresión de distorsiones en relación con cambios de amplitud fuertes y súbitos. En una realización de la invención, N puede escogerse para que corresponda a aproximadamente 7 ms. En un ejemplo de un audio de 44,1 KHz con un filtro de marcas de agua de 2048 muestras de longitud, esto corresponde aproximadamente a 301 muestras. Sin embargo, debería observarse que esto es tan sólo un ejemplo y que también pueden usarse otros valores que oscilen entre 1 y 20 ms, o inclu-
so más.
De manera similar, en una etapa 302 se calcula una energía de movimiento de la señal de datos complementarios según
M_{x}(n)=\frac{1}{N}\sum\limits_{m \geq 0}x^{2}(m)E(n-m).
En una etapa 303 se calcula la función de ganancia como la razón de las señales de energía calculadas:
q(n)=\frac{M_{x}(n)}{M_{ma}(n)+\varepsilon}.
Aquí, se añade al denominador un pequeño parámetro \varepsilon a fin de evitar una posible división por cero. Preferiblemente, \varepsilon se escoge que sea un pequeño número positivo, es decir, 0 < \varepsilon << 1. Por ejemplo, \varepsilon puede elegirse entre 0,001 y 0,1. Sin embargo, también son posibles otros valores.
El valor de q(n) indica cuan intensa es la señal de marca de agua insertada en comparación con la señal portadora. Los valores de q(n) menores que 1 indican que la energía local de la marca de agua excede la energía local de la señal portadora. Por consiguiente, al multiplicar la señal de marca de agua por q(n), la señal de marca de agua se ve atenuada en estas ubicaciones. Los valores de q(n) mayores que 1 indican que la energía de la marca de agua es menor que la de la señal portadora. De la misma manera, la señal de marca de agua se ve amplificada en estas ubicaciones al multiplicarla por q(n) mientras se mantiene la calidad de percepción.
\newpage
Además, debería observarse que el factor 1/N en las ecuaciones anteriores puede omitirse en el cálculo de M_{X}(n) y M_{ma}(n). Cuando se calcula una razón de M_{X}(n) y de M_{ma}(n), tales factores casi se cancelan y no tienen una influencia significativa sobre el resultado.
Debería observarse que las etapas 301 y 302 no tienen porqué realizarse en el orden indicado. Alternativamente, la etapa 302 puede realizarse antes de la etapa 301, o preferiblemente, las etapas 301 y 302 pueden realizarse en paralelo.
Además, debería observarse que, en vez de la energía de señal, pueden utilizarse otras funciones de propiedad que midan propiedades locales de una señal. Por ejemplo, puede usarse una función monótona de la energía, por ejemplo, una potencia de la energía tal como la raíz cuadrada de la energía, que corresponda a usar las cantidades [M_{X}(n)]P y [M_{ma}(n)]P, p > 0, por ejemplo, p = 1/2. Según otra realización de la invención, pueden emplearse los valores absolutos de las señales x(n) y ma(n), respectivamente. Por tanto, se calculan las funciones
M'{}_{x}(n)=\frac{1}{N}\sum\limits_{m \geq 0}^{N}|x(m)| E(n-m) y
M'{}_{ma}(n)=\frac{1}{N}\sum\limits_{m \geq 0}|ma(m)| E(n-m)
en vez de M_{X}(n) y de M_{ma}(n), respectivamente. Una ventaja de esta realización es que sólo requiere pocos recursos computacionales, ya que no implica una operación de elevación al cuadrado.
Alternativamente, al igual que antes, puede usarse una función monótona de las cantidades M'_{X}(n) y M'_{ma}(n) anteriores, por ejemplo, omitiendo el factor 1/N, elevando al cuadrado las cantidades, tomando una raíz cuadrada o algo similar.
Además, debería observarse que, alternativamente a escoger una ventana rectangular en el cálculo de los promedios anteriores, pueden usarse otras funciones de ventana correspondientes a una media ponderada en la que los valores de señal más recientes se ponderan gradualmente con más intensidad que los más distantes.
Por último, debería observarse que, en vez de la razón anterior, pueden utilizarse otras funciones que indiquen la magnitud relativa de las energías locales anteriores, por ejemplo, cualquier función monótona de la razón anterior o un razón regularizada, tal como se describirá en relación con la figura 4.
La figura 4 muestra un diagrama esquemático de una disposición para regular una señal de marca de agua según una realización de la invención. En la figura 4, se supone que se ha generado una señal ma(n) de marca de agua en el dominio del tiempo sobre la base de la señal x(n) de audio portadora, por ejemplo, según uno de los métodos descritos en relación con la figura 1. La disposición comprende un circuito 107 adaptado para calcular la función de ganancia temporal. Según esta realización de la invención, el circuito 107 comprende unos circuitos 401-402 adaptados para calcular las energías M_{ma}(n) de movimiento de la señal de marca de agua y M_{X}(n) de la señal portadora, respectivamente, tal como se describió en relación con la figura 3. En un circuito 403 se calcula una función q(n) de ganancia inicial como una razón de la energía de la señal portadora y la energía de marca de agua, tal como se describió en relación con la figura 3. La disposición puede comprender además un circuito 404 de regularización que garantiza que la función de ganancia temporal no sobrepase un valor g_{max} umbral predeterminado, es decir, el circuito 404 de regularización realiza la siguiente operación:
1
que da como resultado la función g(n) de ganancia regularizada. El valor umbral puede escogerse, por ejemplo, como 1 si no se desea ninguna amplificación de la señal de marca de agua. Los valores g_{max} > 1 corresponden a una amplificación máxima permitida de la señal.
Alternativa o adicionalmente, el circuito 404 puede adaptarse para realizar otras operaciones de regularización a fin de garantizar que la función de ganancia temporal satisfaga ciertas condiciones. Como ejemplo, aplicar un filtro paso bajo garantiza que la función de ganancia temporal no fluctúe en amplitud rápidamente.
Se observa que el parámetro \varepsilon analizado en relación con la figura 3 también impone una cierta restricción a la amplitud máxima de la función q(n).
La disposición puede comprender además un circuito 405 de retardo que está adaptado para retardar la señal
ma(n) de marca de agua por un valor de retardo predeterminado a fin de compensar el retardo introducido por el cálculo de las energías de movimiento en los circuitos 401-402. Las elecciones preferidas del valor de retardo se analizarán en relación con las figuras 5a-d. Un circuito 406 determina el peso global de la marca de agua multiplicando la señal ma(n) de marca de agua por una intensidad i de inserción global, tal como se describió en relación con la figura 1. La función g(n) de ganancia regularizada es multiplicada por la señal de marca de agua retardada y ajustada a escala por un circuito 407 de multiplicación. Finalmente, la señal de marca de agua se suma a la señal x(n) portadora por el circuito 409 sumador, lo que da como resultado la señal y(n) con marca de agua. La disposición comprende además un circuito 408 de retardo adaptado para retardar la señal portadora antes del circuito 409 sumador en correspondencia con los retardos introducidos por el circuito 405 de retardo y del cálculo de g(n).
Las figuras 5a-d ilustran la influencia del elemento 405 de retardo sobre las características de la función de ganancia temporal. En general, un filtro FIR de fase lineal con N coeficientes introduce un retardo correspondiente a (N-1)/2, donde se supone que N es impar. Por consiguiente, el cálculo de la energía de movimiento introduce una retardo correspondiente. Esto se ilustra en las figuras 5a-d, en las que se muestra un ejemplo simplificado de una señal de marca de agua. La línea 502 de puntos ilustra la envolvente de la energía de una señal de marca de agua simplificada, que en las figuras 5a-d se supone que procede de una señal portadora de audio con un ataque intenso en una posición c. En el ejemplo de las figuras 5a-d, se supone que una señal portadora de audio sintética comprende un pico 501 delta en la posición c que tiene como resultado una señal 502 de marca de agua rectangular. En la figura 5a, la correspondiente señal M_{ma}(n) de energía de marca de agua calculada se ilustra como una línea 503 continua. Tal como puede observarse a partir de la figura 5a, la señal de energía promediada aumenta gradualmente a lo largo del intervalo entre unas posiciones a y b correspondientes al intervalo de N muestras de señal a lo largo del cual se promedia la energía. De la misma manera, la señal de energía promediada disminuye a lo largo del intervalo entre unas posiciones d y e. En la figura 5a, se supone que el elemento 505 de retardo no introduce ningún retardo. Por tanto, las características de la línea 503 continua corresponden a las características de la función
M_{ma}(n) promedio local, que está retardada en relación con la señal ma(n) de entrada. Este retardo puede tener como resultado unas propiedades no deseadas en la zona de transición entre los puntos a y b en la que la envolvente de la señal de marca de agua aumenta súbitamente mientras M_{ma}(n). Por consiguiente, la función q(n) de ganancia inicial resultante disminuye sólo gradualmente en el intervalo entre a y b, resultando así en una supresión indebida de la señal de pre-eco. Por otra parte, la señal de post-eco se suprime lo suficientemente también en la región de transición
entre d y e.
La figura 5b ilustra el efecto de la función q(n) de ganancia cuando la señal 502 ma(n) de marca de agua se retarda por un retardo (N-1)/2, es decir, correspondiente a la mitad de la longitud del intervalo de promediación. Tal como puede observarse a partir de la figura 5b, este retardo tiene como resultado una supresión mejorada de las distorsiones de pre-eco, mientras que ahora, las distorsiones de post-eco en la región entre d y e sólo se suprimen parcial-
mente.
En la figura 5c, la señal de marca de agua se retarda en (N-1) muestras, que corresponden a la longitud de la ventana de promediación. Este retardo garantiza que las distorsiones de pre-eco se cancelen a lo largo de toda la región entre b y c. Según esta realización, las distorsiones de post-eco no se suprimen eficazmente en la región entre d y e. Sin embargo, esto puede no reducir significativamente la calidad de percepción de la señal, puesto que la SAP es considerablemente más sensible a los pre-ecos que a los post-ecos (véase, por ejemplo, E. Zwicker y H. Fastl, "Psychoacoustics, Facts and Models", Springer, Berlín, Heidelberg, 1990). Por consiguiente, la elección de un retardo correspondiente a la longitud de la ventana de promediación tiene como resultado un rendimiento mejorado en términos de detección frente a calidad de percepción sin una complejidad computacional adicional.
La falta de supresión total de post-ecos de la realización según la figura 5c puede resolverse mediante una combinación de los enfoques ilustrados en las figuras 5a y 5c. Esta realización se ilustra en la figura 5d, en la que se suprimen las distorsiones tanto de pre-eco como de post-eco. En una realización de la invención, esta combinación puede obtenerse mediante una disposición tal como la que se ilustra en la figura 6.
Debería observarse que pueden emplearse otros valores del retardo distintos a los ejemplos analizados anteriormente, por ejemplo, unos valores de retardo entre (N-1)/2 y (N-1). Por ejemplo, en vez de N-1, puede utilizarse otro retardo que sea igual a, o se desvíe ligeramente de, la longitud N del intervalo usado para promediar. Como ejemplo, en vez de N-1, puede usarse un valor de retardo de N+1, N-3, N+3, N-5, N+5 o similar. Sin embargo, si el retardo se escoge que sea considerablemente mayor que N, los efectos de post-eco pueden volverse cada vez más audibles sin mejorarse adicionalmente la supresión de pre-ecos. Otro factor similar es aplicable al retardo (N-1)/2. Además, a un experto en la técnica le resultará evidente que si N es par, los anteriores retardos (N-1)/2 y (N-1) pueden sustituirse por N/2 y N, respectivamente.
La figura 6 muestra una vista esquemática de una disposición según una realización de la invención que plasma los retardos combinados descritos en relación con la figura 5d. La disposición comprende un elemento 107 adaptado para calcular la función de ganancia temporal tal como se ha descrito en relación con las figuras 3 y 4. La disposición comprende además un circuito 405 para multiplicar la señal de datos complementarios por un factor s de escala global, un elemento 408 de retardo y un circuito 409 sumador para combinar la señal de información con la señal de marca de agua ajustada a escala, tal como se ha descrito en relación con la figura 4. Según esta realización de la invención, un multiplicador 603 multiplica la función g(n) de ganancia temporal calculada por el circuito 107 por la señal de datos complementarios no retardada ajustada a escala. La disposición comprende además un elemento 605 de retardo que retarda la señal de datos complementarios ajustada a escala, preferiblemente por un retardo correspondiente al tamaño de la ventana de promediación, tal como se ha descrito en relación con la figura 5c. La señal retardada es multiplicada por la función g(n) de ganancia por un multiplicador 604. Además, la salida del multiplicador 603 es retarda por un elemento 606 de retardo que corresponde al retardo introducido por el elemento 605 de retardo. La disposición comprende además un circuito 607 adaptado para generar una salida correspondiente al mínimo de la salida del multiplicador 604 y de la salida del elemento 606 de retardo. Por último, la salida del elemento 607 es combinada con la señal de información retardada por un circuito 409. Por consiguiente, la salida del elemento 607 corresponde a una señal de datos complementarios regulada según el enfoque descrito en relación con la figura 5d, dando lugar así a una supresión de las distorsiones tanto de pre-eco como de
post-eco.
Alternativamente, pueden utilizarse otras maneras de implementar los retardos combinados. Por ejemplo, desde un punto de vista de implementación, la eficiencia del cálculo puede mejorarse realizando la comparación según el circuito 607 dentro del circuito 107. Por tanto, según otra realización, la señal M_{ma}(n) que se calcula en el circuito 401 puede dividirse, y las señales divididas pueden retardarse unas en relación con las otras. Las versiones retardadas pueden compararse entonces las unas con las otras muestra a muestra y el valor máximo puede utilizarse como versión final para M_{ma}.
Las figuras 7a-b ilustran dos realizaciones de disposiciones para implementar la función E(n) de filtrado según la invención. La figura 7a ilustra una realización que implementa una estructura de acción directa. En primer lugar, se observa que la forma especial de la función E(n) de filtrado en las realizaciones de las figuras 3 y 4 corresponde a una función de transferencia
H(z)=\sum\limits_{k=0}^{N-1}z^{-k}.
Por tanto, este filtro puede ser implementado por una estructura de acción directa, tal como se ilustra en la figura 7a. En la figura 7a, la estructura se ilustra para un ejemplo en el que N = 5. La disposición en la figura 7a incluye 4 elementos 701 de retardo y 4 sumadores 702. Por tanto, en el caso general, una implementación según la estructura ilustrada en la figura 7a requiere N-1 sumadores y N-1 elementos de retardo.
La complejidad de la disposición anterior puede reducirse significativamente implementando la función de transferencia como una estructura recurrente según
H(z)=\frac{1-z^{N}}{1-z^{-1}}.
Esta estructura puede implementarse según una denominada "forma directa 2" (véase, por ejemplo, Alan V. Oppenheim y Ronald W. Schafer, "Discrete-Time Signal Processing", Prentice Hall, 1999), tal como se ilustra en la figura 7b, de nuevo para el ejemplo de N = 5. Tal como puede observarse, esta implementación requiere 5 elementos 701 de retardo, mientras que el número de sumadores 702 se reduce a 2. Los elementos 703 incluyen una multiplicación por un factor (-1), es decir, un cambio de signo. Por consiguiente, para todas la opciones de N, esta implementación reduce el número de sumadores a 2, mientras que el número de elementos de retardo se aumenta en uno en comparación con la estructura de acción directa de la figura 7a. Por tanto, especialmente para valores más grandes de N, se consigue una reducción considerable de la complejidad.
Se observa que también pueden emplearse otras implementaciones alternativas. Por ejemplo, una denominada estructura de "forma directa 1" (véase, por ejemplo, Alan V. Oppenheim y Ronald W. Schafer, "Discrete-Time Signal Processing", Prentice Hall, 1999) requiere N+1 elementos de retardo y 2 sumadores.
Se entiende que las disposiciones descritas en este documento pueden ser implementadas por cualquier unidad de procesamiento, por ejemplo, un microprocesador programable, un circuito integrado especifico para aplicaciones u otro circuito integrado, una tarjeta inteligente o similar.
Además, debería observarse que la invención se ha descrito en relación con una realización de la invención en el campo de las marcas de agua de señales de audio. Sin embargo, se entiende que el método puede aplicarse para insertar también otros datos complementarios en otros tipos de señales portadoras, tales como señales multimedia, señales de vídeo, animaciones, gráficos, imágenes fijas o similares. En algunas realizaciones, la señal portadora puede representarse en otros dominios aparte del dominio temporal, tal como un dominio espacial en relación con imágenes, y el concepto de amplitud puede reemplazarse por otras cantidades, tales como el brillo, la intensidad o
similares.
Además, debería observarse que la invención puede aplicarse en relación con una variedad de aplicaciones en las que se insertan señales de datos complementarios en una señal de información. Por ejemplo, en el campo de las marcas de agua pueden insertarse señales de datos complementarios como prueba de propiedad de copyright, el rastreo de copias ilegales, el control de equipos de control de copias, la monitorización de emisiones, la verificación de autenticidad, la adición de información auxiliar en señales multimedia, etc. Como ejemplo, un grabador u otro dispositivo puede insertar marcas de agua de audio en una señal de audio antes de la distribución de la señal de audio, por ejemplo, como una señal de comunicación, almacenada en un soporte de almacenamiento o si-
milar.
Debería observarse que las realizaciones anteriormente mencionadas ilustran más que limitan la invención, y que los expertos en la técnica serán capaces de diseñar muchas realizaciones alternativas sin apartarse del alcance de las reivindicaciones adjuntas. En las reivindicaciones, no se interpretará que cualquier símbolo de referencia colocado entre paréntesis limita la reivindicación. La palabra "comprende" no excluye la presencia de otros elementos o etapas diferentes a las que aparecen en una reivindicación. La invención puede implementarse por medio de hardware que comprende varios elementos diferenciados y por medio de un ordenador debidamente programado. En una reivindicación de dispositivo que enumera varios medios, varios de estos medios pueden incorporarse en el mismo elemento de hardware. El mero hecho de que ciertas medidas se citen en reivindicaciones dependientes mutuamente diferentes no indica que una combinación de estas medidas no pueda usarse provechosamente.

Claims (9)

1. Método de regulación de una señal (ma(n)) de datos complementarios a insertar en una señal (x(n)) de información, comprendiendo el método las etapas de:
- determinar una magnitud (g(n)) relativa de una primera propiedad (M_{X}(n)) de la señal de información promediada sobre una región de un tamaño (N) predeterminado y una segunda propiedad (M_{ma}(n)) de la señal de datos complementarios promediada sobre dicha región;
- regular la señal de datos complementarios según la magnitud relativa determinada, caracterizado porque la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende las etapas de:
- retardar (605) la señal de datos complementarios por un retardo correspondiente al tamaño de la región, lo que resulta en una señal retardada;
- regular (604) la señal retardada según la razón determinada, lo que resulta en una primera señal regulada retar-
dada;
- regular (603) la señal de datos complementarios según la razón determinada, lo que resulta en una señal regulada;
- retardar (606) la señal regulada por un retardo correspondiente al tamaño de la región, lo que resulta en una segunda señal regulada retardada; y
- combinar (607) las primera y segunda señales reguladas retardadas.
2. Método según la reivindicación 1, en el que la primera propiedad es una función de la energía local de la señal de información y la segunda propiedad es una función de la energía local de la señal de datos complementarios.
3. Método según la reivindicación 1, en el que la primera propiedad es una magnitud local de la señal de información y la segunda función de propiedad es una magnitud local de la señal de datos complementarios.
4. Método según la reivindicación 1, en el que la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende además la etapa de limitar (404) la magnitud relativa determinada a un valor máximo predeterminado.
5. Método según la reivindicación 1, en el que la etapa de regular la señal de datos complementarios según la magnitud relativa determinada comprende además la etapa de aplicar un filtro paso bajo a la magnitud relativa determinada.
6. Método según la reivindicación 1, en el que la etapa de determinar una magnitud (g(n)) relativa comprende además las etapas de:
- calcular una tercera función de propiedad;
- retardar la tercera función de propiedad para obtener una función de propiedad retardada; y
- combinar la tercera función de propiedad con la función de propiedad retardada para obtener la segunda función de propiedad.
7. Método según la reivindicación 1, en el que la señal de información comprende una señal de audio digital.
8. Disposición para regular una señal (ma(n)) de datos complementarios a insertar en una señal (x(n)) de información, comprendiendo la disposición:
- un medio (107) para determinar una magnitud (g(n)) relativa de una primera propiedad (M_{X}(n)) de la señal de información promediada sobre una región de un tamaño (N) predeterminado y una segunda propiedad (M_{ma}(n)) de la señal de datos complementarios promediada sobre dicha región; y
- un medio (407) para regular la señal de datos complementarios según la magnitud relativa determinada, caracterizada por
- un medio (605) para retardar la señal de datos complementarios por un retardo correspondiente al tamaño de la región, lo que resulta en una señal retardada;
- un medio (604) para regular la señal retardada según la razón determinada, lo que resulta en una primera señal regulada retardada;
- un medio (603) para regular la señal de datos complementarios según la razón determinada, lo que resulta en una señal regulada;
- un medio (606) para retardar la señal regulada por un retardo correspondiente al tamaño de la región, lo que resulta en una segunda señal regulada retardada; y
- un medio (607) para combinar las primera y segunda señales reguladas retardadas.
9. Dispositivo para insertar una señal (ma(n)) de datos complementarios en una señal (x(n)) de información, comprendiendo el dispositivo una disposición según la reivindicación 8.
ES02777654T 2001-11-16 2002-10-24 Insertar datos complementarios en una señal de informacion. Expired - Lifetime ES2255626T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01204387 2001-11-16
EP01204387 2001-11-16

Publications (1)

Publication Number Publication Date
ES2255626T3 true ES2255626T3 (es) 2006-07-01

Family

ID=8181250

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02777654T Expired - Lifetime ES2255626T3 (es) 2001-11-16 2002-10-24 Insertar datos complementarios en una señal de informacion.

Country Status (10)

Country Link
US (1) US7561688B2 (es)
EP (1) EP1449204B1 (es)
JP (1) JP4474161B2 (es)
KR (1) KR20040058289A (es)
CN (1) CN1308912C (es)
AT (1) ATE315822T1 (es)
BR (1) BR0206444A (es)
DE (1) DE60208706T2 (es)
ES (1) ES2255626T3 (es)
WO (1) WO2003042978A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2009634A1 (en) * 2000-12-14 2008-12-31 ECD Systems, Inc. Systems and methods for optical media modification
GB2431837A (en) * 2005-10-28 2007-05-02 Sony Uk Ltd Audio processing
US20130317817A1 (en) * 2012-05-22 2013-11-28 Nuance Communications, Inc. Method and Apparatus for Applying Steganography in a Signed Model
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
US9269363B2 (en) * 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
US9099080B2 (en) 2013-02-06 2015-08-04 Muzak Llc System for targeting location-based communications
US11244692B2 (en) * 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5319735A (en) * 1991-12-17 1994-06-07 Bolt Beranek And Newman Inc. Embedded signalling
US5940429A (en) * 1997-02-25 1999-08-17 Solana Technology Development Corporation Cross-term compensation power adjustment of embedded auxiliary data in a primary data signal

Also Published As

Publication number Publication date
KR20040058289A (ko) 2004-07-03
BR0206444A (pt) 2003-12-30
US7561688B2 (en) 2009-07-14
CN1585971A (zh) 2005-02-23
DE60208706T2 (de) 2006-10-05
DE60208706D1 (de) 2006-04-06
JP4474161B2 (ja) 2010-06-02
EP1449204B1 (en) 2006-01-11
US20050025314A1 (en) 2005-02-03
WO2003042978A1 (en) 2003-05-22
ATE315822T1 (de) 2006-02-15
EP1449204A1 (en) 2004-08-25
JP2005509907A (ja) 2005-04-14
CN1308912C (zh) 2007-04-04

Similar Documents

Publication Publication Date Title
EP1393315B1 (en) Generation and detection of a watermark robust against resampling of a signal
Kirovski et al. Robust spread-spectrum audio watermarking
ES2270516T3 (es) Aparato y metodo para incorporar y extraer informacion en señales analogicas utilizando caracteristicas distribuidas de señales.
JP4504681B2 (ja) 補助データを情報信号に埋め込む方法及びデバイス
CN113257259B (zh) 基于神经网络的安全音频水印加注
ES2255626T3 (es) Insertar datos complementarios en una señal de informacion.
US20180144755A1 (en) Method and apparatus for inserting watermark to audio signal and detecting watermark from audio signal
JP2006503319A (ja) 信号フィルタリング
EP1202250A1 (en) Signal processing device and method therefor and program storing medium
EP1393314B1 (en) Watermarking
Kaur et al. A blind audio watermarking algorithm robust against synchronization attacks
US20020184503A1 (en) Watermarking
EP1093104A1 (en) Method and apparatus for signal processing
Stanković et al. Digital watermarking
US20140072145A1 (en) Audio-playing system and method for protecting storage medium of electrical device
Narangale et al. Effective Prototype Algorithm for Noise Removal Through Gain and Range Change
KP An audio watermarking scheme based on extended bipolar echo kernel and robust to temporal offsets
Nishimura et al. Advanced audio watermarking based on echo hiding: Time-spread echo hiding
Salkade Watermarking of speech through linear prediction parametric modeling