ES2553215T3 - Procesamiento de un flujo de datos digitales - Google Patents

Procesamiento de un flujo de datos digitales Download PDF

Info

Publication number
ES2553215T3
ES2553215T3 ES10710374.9T ES10710374T ES2553215T3 ES 2553215 T3 ES2553215 T3 ES 2553215T3 ES 10710374 T ES10710374 T ES 10710374T ES 2553215 T3 ES2553215 T3 ES 2553215T3
Authority
ES
Spain
Prior art keywords
inter
sequence
flow
segment
signatures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10710374.9T
Other languages
English (en)
Inventor
Xavier Naturel
Sid Ahmed Berrani
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Application granted granted Critical
Publication of ES2553215T3 publication Critical patent/ES2553215T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • H04H60/375Commercial
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/90Aspects of broadcast communication characterised by the use of signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

Procedimiento de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e inter-secuencias, procedimiento que consta de una etapa (E1) de corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y de cálculo de signaturas para estos segmentos, y una etapa (E2) de detección de inter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo: - una primera detección de inter-secuencias mediante detección de separación, separando dicha separación dos inter-secuencias o una inter-secuencia y una secuencia, - una alimentación de una base de referencia (BR) con al menos las signaturas de los segmentos de las intersecuencias detectadas por la primera detección, - una segunda detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa (E1) de corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia (BR).

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCIÓN
Procesamiento de un flujo de datos digitales
La presente Invención se refiere al procesamiento de un flujo de datos digitales. Más exactamente, la Invención se refiere a la extracción y la anotación de secuencias y de Inter-secuencias a partir de un flujo de datos digitales.
Puede tratarse, por ejemplo, de un flujo televisual. Una secuencia es entonces un programa televisado tal como, por ejemplo, una película, un capítulo de una serie, un juego, un informativo, un parte meteorológico, etc. Una intersecuencia es entonces un inter-programa tal como, por ejemplo, un anuncio, un tráiler, un patrocinador que precede al comienzo o que sigue al final de un programa, etc.
El volumen de datos radiofónicos y audiovisuales no deja de crecer dando origen a nuevas necesidades y servicios que implican puesta a disposición del público de contenidos. Se trata, por ejemplo, de servicios de televisión a la carta, de servicios de control de la difusión de contenidos, etc. Estos servicios requieren un procesamiento de los flujos de datos correspondientes para extraer de ellos secuencias e ¡nter-secuencias.
La técnica de la invención puede aplicarse concreta, aunque no exclusivamente, a la ¡mplementación de dichos servicios.
Existen diferentes técnicas de extracción de secuencias y de ¡nter-secuencias a partir de un flujo de datos digitales.
El enfoque más sencillo y más directo se basa en la utilización de informaciones de programación vehiculadas en el propio flujo mediante EIT (por Event Information Tables en inglés (tabla de información de eventos)) o puestas a disposición de forma independiente por el emisor del flujo como, por ejemplo, una guía de programas.
Este enfoque presenta el inconveniente de ser impreciso e incompleto. En efecto, las informaciones en las que se basa son a menudo, ellas mismas, imprecisas (por ejemplo, los horarios se dan a título indicativo) e incompletas (muchos programas, concretamente los programas pequeños no son mencionados en ella).
Otro inconveniente es que cualquier cambio de programación no tenido en cuenta en las EIT o la guía de programas genera un error durante la extracción.
Otro enfoque se basa en el análisis del contenido del flujo de datos digitales.
En su tesis titulada “Structuration automatique de flux vidéo de télévision” (estructuración automática de flujo de video de televisión), Universidad de Rennes 1, 2007, Xavier Naturel combina varias técnicas.
Previamente, un conjunto de referencia que consta de los descriptores que caracterizan programas e interprogramas se constituye manualmente.
A continuación, el análisis del contenido del flujo se realiza en varias etapas.
El flujo se corta y los trozos obtenidos son caracterizados mediante descriptores. Cada descriptor se compara con los almacenados en el conjunto de referencia. Cuando se establece una correspondencia, el trozo es indexado. Los trozos que no se han podido indexar se clasifican en programas o ¡nter-programas en función de su duración. A continuación, periódicamente los trozos son anotados mediante un análisis global del flujo que se parece al de la EIT.
El enfoque puede completarse, independientemente de las operaciones descritas anteriormente, mediante la aplicación de una técnica de detección de separación entre dos ¡nter-programas. En un flujo televisual, una separación se caracteriza por imágenes monocromas y silencios. Esta detección permite identificar inter-programas cuyos descriptores no habrían sido almacenados en el conjunto de referencia.
El enfoque de Xavier Naturel se basa principalmente en la constitución de un conjunto de referencia. Las prestaciones de este enfoque están limitadas por el contenido de este conjunto de referencia creado manualmente. Estas prestaciones se degradan en cuanto nuevos programas o inter-programas son insertados en el flujo.
Finalmente, al basarse este enfoque en un análisis global del flujo para la anotación, no puede proporcionar resultados de anotación sobre la marcha, es decir a medida que se produce la recepción de un flujo difundido o a medida que se produce la lectura de un flujo registrado.
Otros enfoques de extracción de secuencias o de i nter-secuencias a partir de un flujo de datos digitales se basan en el carácter repetitivo de i nter-secuencias en el flujo.
5
10
15
20
25
30
35
40
45
50
55
60
65
En el documento titulado “A non-supervlsed approach for repeated sequence detectlon in tv broadcast streams”. Signal Processing: Image Communlcatlon, número especial en “Semantic Analysis for Interactive Multimedia Services”, 2008, G. Manson et al., basan su enfoque en la detección de Ínter-programas que se repiten en el flujo.
Se calculan descriptores simples para todas las imágenes del flujo y se calculan descriptores más complejos para ciertas imágenes del flujo, también llamadas imágenes clave. Los dos tipos de descriptores se almacenan en una base de datos.
Periódicamente, los descriptores de las imágenes clave almacenados en la base de datos se comparan entre sí. Los descriptores idénticos o similares se agrupan. Estos agrupamientos permiten detectar ¡nter-programas que se repiten. Estos ¡nter-programas se reconstituyen a continuación a partir de las imágenes clave a las que se asocian las imágenes vecinas mediante análisis de los descriptores simples correspondientes.
Los programas se determinan a continuación a partir de los Ínter-programas.
El inconveniente de este enfoque es que la detección de los Ínter-programas se realiza periódicamente, debiendo ser el periodo suficientemente largo para detectar numerosas repeticiones. De este modo, este enfoque no permite un procesamiento sobre la marcha del flujo.
Uno de los objetivos de la invención es remediar los inconvenientes de la técnica anterior mencionada anteriormente.
De este modo, la presente invención se refiere, de acuerdo con un primer aspecto, a un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias, procedimiento que consta de una etapa de corte sobre la marcha del flujo en segmentos y de cálculo de signaturas para estos segmentos y una etapa de detección de inter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo:
una primera detección de inter-secuencias mediante detección de separación,
una alimentación de una base de referencia con al menos las signaturas de los segmentos de las intersecuencias detectadas mediante la primera detección,
- una segunda detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa de corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia.
Al realizarse el procesamiento del flujo de datos digitales (detección de inter-secuencias y alimentación de una base de referencia) sobre la marcha, es más rápido, más económico y puede realizarse para cualquier flujo sin conocimiento previo de éste.
Al realizarse la alimentación de la base de referencia automáticamente durante el procesamiento del flujo sobre la marcha, esta alimentación no es manual y no necesita procesamiento previo. En consecuencia, es menos costosa.
Al implementar la detección de inter-secuencias dos métodos complementarios vinculados entre sí por su interacción con la base de referencia, esta detección es a la vez más rápida y más eficaz.
De acuerdo con una característica preferida, la comparación de las signaturas de un segmento del flujo, llamado segmento de solicitud, con las signaturas de un segmento de una Ínter-secuencia contenidas en la base de referencia, denominándose este segmento, segmento candidato, consta de un cálculo de distancia entre el segmento de solicitud y el segmento candidato.
El cálculo de distancia entre un segmento de solicitud y un segmento candidato permite definir si estos dos segmentos son idénticos o casi idénticos.
De acuerdo con una característica preferida, la base de referencia consta, además, de estructuras de datos relativas a los segmentos de las inter-secuencias detectadas mediante la primera detección.
De este modo, los datos contenidos en la base de referencia permiten tener un buen conocimiento de los segmentos de las inter-secuencias detectadas.
De acuerdo con una característica preferida, cuando la distancia entre un segmento de solicitud y un segmento candidato es inferior a un valor umbral dado de distancia, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a este segmento candidato.
De este modo, en cualquier momento se puede decir si un segmento contenido en la base de referencia ha servido para la detección de una Ínter-secuencia mediante el método de reconocimiento. De acuerdo con la naturaleza del indicador de reconocimiento, se puede conocer el número de veces en las que se ha producido esta incidencia.
5
10
15
20
25
30
35
40
45
50
55
60
De acuerdo con una característica preferida, el procedimiento de procesamiento de un flujo de datos digitales de acuerdo con la invención consta de una etapa de limpieza de la base de referencia que comprende la supresión de estructuras de datos de segmentos en función del resultado de una comparación del valor del indicador de reconocimiento, comprendido en las estructuras de datos de los segmentos contenidos en la base de referencia, con un valor umbral dado de reconocimiento.
La supresión periódica de los segmentos que no han servido para la detección de una inter-secuencia mediante el método de reconocimiento permite aligerar la base de referencia haciendo de este modo al procedimiento más rápido en su desarrollo y menos costoso, concretamente para la preservación de esta base.
De acuerdo con una característica preferida, el procedimiento de acuerdo con la invención consta de una etapa de consolidación de Ínter-secuencias que permiten identificar si existe solapamiento entre dos inter-secuencias detectadas sucesivamente.
La identificación de solapamiento entre dos inter-secuencias permite definir más rigurosamente estas intersecuencias y obtener un procedimiento más preciso.
De acuerdo con una característica preferida, el procedimiento de acuerdo con la invención consta de una etapa de anotación de programa sobre la marcha mediante aplicación de criterios temporales.
De este modo la anotación realizada sobre la marcha es más rápida y permite obtener programas anotados a medida que se produce su difusión o su lectura.
La invención también se refiere a un sistema de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias, sistema que efectúa un corte sobre la marcha del flujo en segmentos y un cálculo de signaturas para estos segmentos y consta de:
un primer módulo de detección de inter-secuencias mediante detección de separación,
una base de referencia alimentada con al menos las signaturas de los segmentos de las inter-secuencias detectadas por el primer módulo de detección,
- un segundo módulo de detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante el corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia,
procesando el primer módulo y el segundo módulo de detección de inter-secuencias el flujo sobre la marcha.
El sistema de acuerdo con la invención presenta las mismas ventajas que el procedimiento descrito anteriormente.
La invención también se refiere a un producto de programa informático que comprende instrucciones de código de programa grabadas en o transmitidas por un soporte legible por un ordenador, para implementar las etapas del procedimiento descrito anteriormente cuando dicho programa es ejecutado en un ordenador.
Otras características y ventajas de la presente invención aparecerán en la descripción a continuación de realizaciones preferidas descritas en referencia a las figuras, en las que:
- la figura 1 representa una realización de un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e inter-secuencias,
- la figura 2 representa una realización de un sistema capaz de implementar el procedimiento de la figura 1.
La invención se refiere al procesamiento de un flujo de datos digitales que comprende secuencias e intersecuencias. Estas secuencias e inter-secuencias se diferencian unas de otras esencialmente por su duración, siendo una inter-secuencia mucho más corta que una secuencia.
Este procesamiento pretende extraer secuencias o inter-secuencias a partir del flujo de datos digitales y anotarlas.
Este procesamiento se realiza sobre la marcha es decir a medida que se produce la recepción para un flujo difundido mediante una red o a medida que se produce la lectura para un flujo grabado.
Un flujo de datos digitales puede cortarse en segmentos. Las secuencias e inter-secuencias comprendidas en este flujo son cortadas, a su vez, en segmentos. Un segmento es un trozo continuo del flujo y comprende un comienzo y un final. Un segmento está compuesto por un conjunto de segmentos elementales. Puede calcularse una signatura para un segmento elemental permitiendo de este modo caracterizarlo.
5
10
15
20
25
30
35
40
45
50
55
La invención se expone a continuación para una realización preferida en la que el flujo de datos digitales considerado es un flujo televisual. Esta realización es ilustrativa de la invención y no puede considerarse limitante de la misma.
Un flujo televisual corresponde a un contenido de audio y video difundido de forma continua por un canal de televisión.
Este contenido comprende secuencias llamadas programas (o programas televisados) e inter-secuencias llamadas inter-programas.
Un programa es, por ejemplo, una película, un capítulo de una serie, un juego, un informativo, un parte meteorológico, etc. Un ínter-programa es, por ejemplo, un anuncio, un tráiler, un patrocinador que precede al comienzo o que sigue al final de un programa, etc.
Dos programas están separados por uno o más inter-programas. Un programa puede estar constituido por varias partes separadas por inter-programas como, por ejemplo, cuando una película es interrumpida por anuncios.
Entre dos inter-programas puede encontrarse una separación que comprende un conjunto de imágenes monocromas contiguas, acompañadas por silencio.
Puede existir o no existir separación entre un inter-programa y un programa.
Los segmentos que componen los programas e inter-programas son planos. Los segmentos elementales son imágenes. En el caso de un flujo televisual, un plano es un conjunto de imágenes filmadas sin interrupción.
La figura 1 representa una realización de un procedimiento de procesamiento de un flujo de datos digitales que comprende programas (o secuencias) e inter-programas (o inter-secuencias).
Durante una etapa E1, el flujo se corta en planos (o segmentos) y se calcula una signatura para las imágenes (o segmentos elementales) constitutivas de estos planos.
Una signatura caracteriza el contenido de una imagen.
Para calcular la signatura S de una imagen, ésta se divide en 4 bloques en cada uno de los cuales se realiza un sub- muestreo hacia un bloque 8x8 y a continuación un cálculo de DCT (por Discrete Cosine Transform en inglés (transformada discreta del coseno)).
De cada DCT se extraen 16 coeficientes: 1 coeficiente DC (valor medio) y 15 coeficientes AC (componente frecuencial). Cada uno de estos coeficientes se cuantifica en una longitud de 1 bit, que conduce a una signatura de 64 bits de longitud por concatenación de los 4 bloques.
El coeficiente DC asociado al bloque i, con i variando de 0 a 3, y denominado DC' se calcula de la siguiente forma:
Í0 si DC* >DC
DC = ___
1 siDC' <DC
e
con DC = -1-100*.
4 í=o
Los 15 coeficientes AC asociados al bloque i, con i variando de 0 a 3, y denominados AC1- con j variando de 0 a 14, se calculan de la siguiente forma:
imagen1
O si AC;>AC^a
con : AC' „ = mediana
í, j=oa 14
imagen2
La signatura S de una imagen se escribe entonces de la forma:
imagen3
La etapa siguiente E2 es una etapa de detección de inter-programas (o inter-secuencias).
5
10
15
20
25
30
35
40
45
50
55
60
65
La detección de Ínter-programas se realiza mediante dos métodos diferentes vinculados entre sí por su interacción con una base de referencia.
El primer método de detección de Ínter-programas se basa en la detección de la separación que existe entre dos ínter-programas.
El método aplicado es un método clásico tal como se describe por R Lienhart et al., en el documento titulado “On the detection and recognition of televisión commercials”, en Proceedings of the IEEE International Conference on Multimedia Computing and Systems, Ottawa, Canadá, 1997.
La detección de separación consta de una detección de silencio y una detección de imágenes monocromas.
Para detectar un silencio, se mide la energía de la señal de audio vehiculada en el flujo en un instante dado. Si el valor de esta energía es inferior a un valor umbral dado de energía, entonces se considera que este instante corresponde a un silencio.
A continuación, se calcula un indicado de mono cromaticidad para las imágenes situadas alrededor del instante de silencio detectado. Para ello se calcula un histograma de luminancia de la imagen considerada en escala de grises y a continuación la entropía de este histograma. Si el valor de esta entropía es inferior a un valor umbral dado de entropía, entonces se considera que la imagen correspondiente es una imagen monocroma.
Considerando las imágenes alrededor de un instante de silencio detectado, se obtienen los límites de comienzo y de final (la imagen de comienzo y la imagen de final) de la separación.
De ello se deduce el límite de final del Ínter-programa que precede a la separación y el límite de comienzo del interprograma que sigue a la separación. De la misma forma, cuando existe una separación entre un Ínter-programa y un programa, de ella se deduce el límite de final del Ínter-programa o del programa que precede a la separación y el límite de comienzo respectivamente del programa o del Ínter-programa que sigue a la separación.
Si la distancia (por ejemplo en tiempo o en número de imágenes) entre dos separaciones es pequeña, entonces se deduce de ello que el trozo de flujo comprendido entre estas dos separaciones es un inter-programa. Se pueden determinar los límites de este inter-programa.
Al contrario, si la distancia entre dos separaciones es grande, entonces se deduce de ello que el trozo de flujo comprendido entre estas dos separaciones es un programa o una parte de programa. También se pueden determinar los límites de este programa o de esta parte de programa.
A medida que se produce la detección de inter-programas mediante el método de detección de separación descrito anteriormente, una base de referencia BR es alimentada.
En la inicialización, es decir antes del comienzo del procesamiento del flujo sobre la marcha, la base de referencia BR está vacía.
Cuando se detecta un inter-programa, se forman pares (signatura, identificador) y se almacenan en una tabla de troceado (“tabla hash”).
Los identificadores designan los planos constitutivos del inter-programa detectado. Estos planos pertenecen al conjunto de los planos obtenidos durante la etapa E1 anterior.
Las signaturas son las de las imágenes constitutivas de un plano tales como las que se han calculado durante la etapa E1 anterior.
Hay tantos pares (signatura, identificador) como imágenes.
A un plano le corresponde un único identificador y viceversa. El identificador de un plano apunta a una estructura de datos que agrupa informaciones relativas a este plano como, por ejemplo, las signaturas de las imágenes constitutivas de este plano, un indicador de reconocimiento, etc.
La base de referencia BR consta de la tabla de troceado y las estructuras de datos relativas a los planos.
El segundo método de detección de inter-programas se basa en el reconocimiento de inter-programas.
Para un plano obtenido durante la etapa E1 de corte del flujo en planos, se revisa si éste está presente en la base de referencia BR, comparando las signaturas relativas a este plano con las contenidas en la base de referencia BR.
5
10
15
20
25
30
35
40
45
50
55
60
65
Para ello, se analiza si la signatura de la primera imagen del plano considerado, llamado plano de solicitud, se encuentra en la tabla de troceado. SI esta signatura se encuentra en la tabla de troceado, entonces el ¡dentificador al que está asociada la signatura permite recuperar un plano, llamado plano candidato.
A continuación se calcula una distancia entre el plano de solicitud y el plano candidato. Esta distancia es una media de las distancias, calculadas mediante la distancia de Hamming, entre las signaturas de las Imágenes respectivamente del plano de solicitud y del plano candidato.
SI el valor de la distancia calculado es inferior a un valor umbral dado de distancia, entonces el plano de solicitud se considera como reconocido, es decir idéntico o casi idéntico al plano candidato.
Se considera que un plano reconocido pertenece a un inter-programa, por definición de la base de referencia BR.
Cuando un plano es reconocido, un indicador de reconocimiento (por ejemplo, un valor numérico, una Indicación temporal como la hora actual para un flujo difundido, etc.) se añade o se actualiza en la estructura de datos asociada a este plano en la base de referencia BR.
Las tres operaciones realizadas durante esta etapa E2, a saber la detección de inter-programas mediante el primer y el segundo método, así como la alimentación de la base de referencia BR, se realizan en paralelo.
Los dos métodos de detección de Inter-programas se completan y permiten detectar de una manera los interprogramas del flujo. Por ejemplo, el segundo método de detección (por reconocimiento) permite detectar interprogramas unidos a programas y para los cuales no existe separación entre los dos.
Los dos métodos de detección de inter-programas están vinculados entre sí por su interacción con la base de referencia BR. El primer método permite alimentar la base de referencia BR. El segundo método explota los datos de la base de referencia BR.
La etapa siguiente E3 es una etapa de extracción y de anotación de programa.
Esta etapa consta de tres sub-etapas E31, E32 y E33 realizadas sobre la marcha.
La sub-etapa E31 es una etapa de consolidación de inter-programas.
Esta etapa permite consolidar los resultados obtenidos mediante los dos métodos de detección de inter-programas descritos anteriormente
Ésta permite concretamente determinar en ciertos casos, de forma más precisa, los límites (imagen de comienzo e imagen de final) de un inter-programa detectado.
Para ello, se consideran dos inter-programas IPk e IPk+i detectados sucesivamente. Estos dos inter-programas son detectados de forma indiferente mediante uno u otro de los dos métodos expuestos anteriormente.
IPk se define mediante el intervalo [dk, fk] en el que dk es el Instante de la imagen de comienzo y fk es el Instante de la imagen de final de este inter-programa.
IPk+i se define mediante el Intervalo [dk+i, fk+i] en el que dk+i es el instante de la Imagen de comienzo y fk+i es el instante de la imagen de final de este Inter-programa.
Se considera también Lmax, la longitud máxima en tiempo de un inter-programa.
Si la distancia temporal que separa la imagen de final del Inter-programa IPk de la imagen de comienzo del Inter- programa siguiente IPk+i es Inferior a la longitud máxima de un inter-programa, es decir:
dk+ 1 - fk — Lmax,
entonces de ello se deduce que existe solapamiento entre los dos inter-programas IPk e IPk+i o que estos dos interprogramas están separados por un espacio más corto que la longitud máxima en tiempo de un inter-programa (Lmax).
Se redefinen entonces los límites del inter-programa IPk mediante reunión de los dos Inter-programas IPk e IPk+i, Incluyendo, llegado el caso, el espacio comprendido entre estos dos inter-programas. Se obtiene entonces:
IPk - [dk, fk + ij.
La sub-etapa E32 es una etapa de formación de programas.
5
10
15
20
25
30
35
40
45
50
55
60
65
En cuanto dos ¡nter-programas sucesivos IPi e IP1+1 están definidos correctamente por sus intervalos respectivos [di, fi] y [di+i, fi+i] es posible determinar si una parte de programa o un programa se encuentra entre estos dos interprogramas.
Para ello, se contempla la distancia temporal di+i - fi que separa la imagen de final del inter-programa IPi de la imagen de comienzo del inter-programa siguiente IP1+1.
Si esta distancia es superior a la longitud máxima de un inter-programa, es decir di+i - fi > Lmax, entonces se deduce de ello que el trozo de flujo situado entre estos dos inter-programas es una parte de programa o un programa.
Esta parte de programa o este programa se define mediante el intervalo [fi+1, di+i-1] en el que fi + 1 es el instante de la imagen de comienzo y di+i-1 es el instante de la imagen de final de este programa o de esta parte de programa.
La sub-etapa siguiente E33 es una etapa de anotación de programas.
La anotación se realiza sobre la marcha a partir de la detección de una parte de programa o de un programa para cada programa o parte de programa formado en la sub-etapa E32 anterior.
Esta anotación se basa en la utilización de una guía de programas como por ejemplo una EIT (por Event Information Table en inglés). Una guía de programas consta de informaciones relativas a los programas tales como el nombre (o etiqueta), la hora aproximada de comienzo, la hora aproximada de final, la duración aproximada, etc.
La anotación se efectúa utilizando criterios de proximidad temporal.
Para ello, se compara el instante de la imagen de comienzo y el instante de la imagen de final de una parte de programa o de un programa formado durante la sub-etapa anterior E32 con, respectivamente, las horas de comienzo y las horas de final de programas contenidos en la guía de programas.
La etiqueta de la guía de programas seleccionada y que sirve para anotar el programa o la parte de programa considerado es la que corresponde al solapamiento temporal máximo con el programa o la parte de programa considerado.
Cuando dos partes de programa son anotadas mediante la misma etiqueta, estas dos partes de programa se fusionan. Esto corresponde, por ejemplo, a una película interrumpida por la publicidad.
La etapa siguiente E4 es una etapa de limpieza de la base de referencia BR.
La limpieza se realiza periódicamente, estando el periodo de limpieza previamente definido.
Se recuerda que, durante la etapa E2, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a un plano y contenida en la base de referencia BR cuando este plano permite detectar un inter- programa mediante el segundo método de detección, es decir mediante el método de reconocimiento de interprogramas.
La limpieza de la base de referencia consta de la supresión de la estructura de datos asociada a un plano en función del resultado de una comparación del indicador de reconocimiento de este plano con un valor umbral dado de reconocimiento.
De este modo, un plano que no ha o ha servido poco para la detección de inter-programas se suprime de la base de referencia BR.
La figura 2 representa una realización de un sistema capaz de implementar un procedimiento de procesamiento de un flujo de datos digitales que comprende secuencias e ínter-secuencias tal como se ha descrito anteriormente.
El sistema consta de un módulo M1 de corte en segmentos sobre la marcha de un flujo de datos digitales recibido o leído.
El módulo M1 comprende también medios de cálculo de una signatura para los segmentos elementales constitutivos de los segmentos obtenidos posteriormente al corte del flujo.
El módulo M1 implementa la etapa E1 tal como se ha descrito anteriormente.
El sistema comprende también un primer y un segundo módulo, respectivamente M2 y M3, de detección de intersecuencias.
5
10
15
20
25
30
35
40
El primer módulo M2 de detección de inter-secuencias detecta inter-secuenclas mediante aplicación de un método de detección de separación que existe entre dos inter-secuencias, tal como se ha descrito en la etapa E2 anteriormente.
El segundo módulo M3 de detección de inter-secuencias detecta inter-secuencias mediante aplicación de un método de reconocimiento de inter-secuencias, tal como se ha descrito en la etapa E2 anteriormente.
El premier y el segundo módulo, respectivamente M2 y M3, de detección de inter-secuencias procesan el flujo sobre la marcha.
El sistema comprende también una base de referencia BR alimentada por el primer módulo M2 de detección de inter-secuencias. El contenido de la base de referencia BR es explotado por el segundo módulo M3 de detección de inter-secuencias para el reconocimiento de inter-secuencias.
La alimentación, la explotación y el contenido de la base de referencia BR se han descrito anteriormente en la etapa
E2.
Los procesamientos efectuados sobre la marcha en el flujo mediante el primer y el segundo módulo, respectivamente M2 y M3, de detección así como la alimentación de la base de referencia BR se realizan en
paralelo.
En referencia a la sub-etapa E31, el sistema comprende un módulo M4 de consolidación de inter-programas.
En referencia a la sub-etapa E32, el sistema comprende también un módulo M5 de formación de programas.
El sistema comprende también un módulo M6 de anotación de programas.
En referencia a la etapa E33 descrita anteriormente, el módulo M6 de anotación de programas asigna una etiqueta a los programas formados por el módulo M5 de formación de programas.
El sistema comprende también un módulo M7 de limpieza de la base de referencia, tal como se ha descrito anteriormente en la etapa E4.
El sistema comprende además una unidad de control central, no representada, conectada a cada uno de los módulos M1 a M7 y adaptada para controlar su funcionamiento.
Los módulos M1 a M7 pueden ser módulos de software que forman un programa informático. La invención se refiere, también, a un programa informático para un sistema de extracción de secuencias y/o de inter-secuencias a partir de un flujo de datos digitales que comprende instrucciones de código de programa para hacer ejecutar el procedimiento descrito anteriormente por el sistema.
Los diferentes módulos de software pueden ser almacenados en o transmitidos por un soporte de datos. Éste puede ser un soporte físico de almacenamiento, por ejemplo un CD-ROM, un disco magnético o un disco duro, o bien un soporte transmisible tal como una señal eléctrica, óptica o radio.

Claims (9)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    REIVINDICACIONES
    1. Procedimiento de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e Ínter-secuencias, procedimiento que consta de una etapa (E1) de corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y de cálculo de signaturas para estos segmentos, y una etapa (E2) de detección de Ínter-secuencias durante la cual las siguientes operaciones se realizan sobre la marcha en el flujo:
    - una primera detección de ínter-secuencias mediante detección de separación, separando dicha separación dos Ínter-secuencias o una ínter-secuencia y una secuencia,
    - una alimentación de una base de referencia (BR) con al menos las signaturas de los segmentos de las ínter- secuencias detectadas por la primera detección,
    - una segunda detección de ínter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante la etapa (E1) de corte, con las signaturas de los segmentos de las Ínter-secuencias contenidas en la base de referencia (BR).
  2. 2. Procedimiento de acuerdo con la reivindicación 1, caracterizado por que la comparación de las signaturas de un segmento del flujo, denominado segmento de solicitud, con las signaturas de un segmento de una Ínter-secuencia contenidas en la base de referencia (BR), denominándose este segmento, segmento candidato, consta de un cálculo de distancia entre el segmento de solicitud y el segmento candidato.
  3. 3. Procedimiento de acuerdo con la reivindicación 1 o 2, caracterizado por que la base de referencia (BR) consta, además, de estructuras de datos relativas a los segmentos de las Ínter-secuencias detectadas mediante la primera detección.
  4. 4. Procedimiento de acuerdo con las reivindicaciones 2 y 3, caracterizado por que, cuando la distancia entre un segmento de solicitud y un segmento candidato es inferior a un valor umbral dado de distancia, un indicador de reconocimiento se añade o se actualiza en la estructura de datos relativa a este segmento candidato.
  5. 5. Procedimiento de acuerdo con las reivindicaciones 3 y 4, caracterizado por que consta de una etapa (E4) de limpieza de la base de referencia (BR) que comprende la supresión de estructuras de datos de segmentos en función del resultado de una comparación del valor del indicador de reconocimiento, comprendido en las estructuras de datos de los segmentos contenidas en la base de referencia (BR), con un valor umbral dado de reconocimiento.
  6. 6. Procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 5, caracterizado por que consta de una etapa (E31) de consolidación de inter-secuencias que permite identificar si hay solapamiento entre dos intersecuencias detectadas sucesivamente.
  7. 7. Procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 6, caracterizado por que consta de una etapa (E33) de anotación de programa sobre la marcha mediante aplicación de criterios temporales.
  8. 8. Sistema de procesamiento de un flujo de datos digitales de tipo audio y video que comprende secuencias e intersecuencias, efectuando dicho sistema un corte sobre la marcha del flujo en segmentos, en el que un segmento es un trozo continuo del flujo, y un cálculo de signaturas para estos segmentos, que consta de:
    - un primer módulo (M2) de detección de inter-secuencias mediante detección de separación, separando dicha separación dos inter-secuencias o una inter-secuencia y una secuencia,
    - una base de referencia (BR) alimentada con al menos las signaturas de los segmentos de las inter-secuencias detectadas por el primer módulo de detección,
    - un segundo módulo (M3) de detección de inter-secuencias mediante comparación de las signaturas de los segmentos del flujo, obtenidos durante el corte, con las signaturas de los segmentos de las inter-secuencias contenidas en la base de referencia (BR),
    procesando el primer módulo (M2) y el segundo módulo (M3) de detección de inter-secuencias el flujo sobre la marcha.
  9. 9. Producto de programa informático que comprende instrucciones de código de programa grabadas en o transmitidas por un soporte legible por un ordenador, para implementar las etapas del procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 7 cuando dicho programa es ejecutado en un ordenador.
ES10710374.9T 2009-02-27 2010-02-23 Procesamiento de un flujo de datos digitales Active ES2553215T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0951266 2009-02-27
FR0951266A FR2942686A1 (fr) 2009-02-27 2009-02-27 Traitement d'un flux de donnees numeriques.
PCT/FR2010/050304 WO2010097540A1 (fr) 2009-02-27 2010-02-23 Traitement d'un flux de données numériques

Publications (1)

Publication Number Publication Date
ES2553215T3 true ES2553215T3 (es) 2015-12-07

Family

ID=41136645

Family Applications (1)

Application Number Title Priority Date Filing Date
ES10710374.9T Active ES2553215T3 (es) 2009-02-27 2010-02-23 Procesamiento de un flujo de datos digitales

Country Status (5)

Country Link
EP (1) EP2401700B1 (es)
ES (1) ES2553215T3 (es)
FR (1) FR2942686A1 (es)
PL (1) PL2401700T3 (es)
WO (1) WO2010097540A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009200595A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 署名管理プログラム、署名管理方法及び署名管理装置
FR2973537A1 (fr) 2011-03-28 2012-10-05 France Telecom Procede et dispositif d'acces a un contenu diffuse enregistre

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7269330B1 (en) * 1996-11-01 2007-09-11 Televentions, Llc Method and apparatus for controlling a video recorder/player to selectively alter a video signal
WO2005104676A2 (en) * 2004-03-29 2005-11-10 Nielsen Media Research, Inc. Methods and apparatus to detect a blank frame in a digital video broadcast signal

Also Published As

Publication number Publication date
EP2401700B1 (fr) 2015-08-26
PL2401700T3 (pl) 2016-01-29
EP2401700A1 (fr) 2012-01-04
FR2942686A1 (fr) 2010-09-03
WO2010097540A1 (fr) 2010-09-02

Similar Documents

Publication Publication Date Title
US20210287012A1 (en) Detection of demarcating segments in video
US10459973B2 (en) Unordered matching of audio fingerprints
CN101821734B (zh) 时基媒体之间的匹配的检测和分类
KR102091414B1 (ko) 방송되는 미디어 관련 전자 메시징 향상
Herley ARGOS: Automatically extracting repeating objects from multimedia streams
US8068719B2 (en) Systems and methods for detecting exciting scenes in sports video
US20060059510A1 (en) System and method for embedding scene change information in a video bitstream
WO2019128724A1 (zh) 数据处理方法及装置
KR20120090101A (ko) 디지털 비디오 고속 정합 시스템
EP1983755A1 (en) Method to transmit video data in a data stream and associated metadata
WO2013097101A1 (zh) 分析视频文件的方法和装置
CN112699787A (zh) 一种广告插入时间点的检测方法及装置
ES2553215T3 (es) Procesamiento de un flujo de datos digitales
US8214854B2 (en) Method and system for facilitating analysis of audience ratings data for content
CN114782879A (zh) 视频识别方法、装置、计算机设备和存储介质
US10178415B2 (en) Chapter detection in multimedia streams via alignment of multiple airings
CN105912615A (zh) 一种基于人类语音内容索引的音频和视频文件管理方法
US20150032718A1 (en) Method and system for searches in digital content
Senarath et al. Automated TV commercial tracking and auditing
CN115495600A (zh) 一种基于特征的视音频检索方法
CN103299319B (zh) 分析视频文件的方法和装置
Nadeem Ashraf Forensic Multimedia File Carving
Radhakrishnan et al. Sports program boundary detection
Ibrahim et al. Research Article TV Stream Structuring
Jacobs et al. Inter-video Similarity for Video Parsing