PT1261155E - Método e sistema para reconhecimento de segmentos de difusão - Google Patents
Método e sistema para reconhecimento de segmentos de difusão Download PDFInfo
- Publication number
- PT1261155E PT1261155E PT02076018T PT02076018T PT1261155E PT 1261155 E PT1261155 E PT 1261155E PT 02076018 T PT02076018 T PT 02076018T PT 02076018 T PT02076018 T PT 02076018T PT 1261155 E PT1261155 E PT 1261155E
- Authority
- PT
- Portugal
- Prior art keywords
- segment
- signature
- broadcast
- signatures
- segments
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/37—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
- H04H60/372—Programme
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/785—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/59—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/90—Aspects of broadcast communication characterised by the use of signatures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Television Systems (AREA)
- Circuits Of Receivers In General (AREA)
- Image Analysis (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Stereo-Broadcasting Methods (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Description
ΕΡ 1 261 155 /PT
DESCRIÇÃO "Método e sistema para reconhecimento de segmentos de difusão"
ANTECEDENTES DO INVENTO 0 presente invento refere-se ao reconhecimento automático de sinais amplamente disseminados, tais como, de difusão de rádio e televisão e semelhantes.
Os anunciantes de difusão necessitam de confirmar que as suas mensagens publicitárias foram exibidas na sua totalidade pelas estações emissoras designadas e nas alturas agendadas. Além disso, pode ser desejável para os anunciantes conhecer as mensagens publicitárias que a sua concorrência exibiu. Uma técnica convencional para monitorizar as mensagens publicitárias que foram exibidas envolve o emprego de um grande número de pessoas para verem designados canais de emissão ao longo do dia a fim de registarem esta informação num diário escrito. Será apreciado que esta técnica convencional envolve a necessidade de empregar um grande número de pessoas bem como a necessidade de reunir os seus registos escritos e introduzir os seus conteúdos num sistema automático de processamento de dados a fim de produzir relatórios de interesse para anunciantes particulares. Esta técnica convencional possui um custo periódico relativamente elevado. Numa tentativa de reduzir estes custos, foi desenvolvido um sistema automático de reconhecimento de padrões como, por exemplo, o apresentado na patente US n.° 4,739,398.
Na técnica de reconhecimento de padrões contínuos apresentada na patente US n.° 4,739,398, um segmento ou porção de um sinal pode ser identificado através de reconhecimento de padrões contínuos numa base de tempo real. 0 sinal pode ser transmitido, por exemplo, via rádio, via satélite, cabo, fibra óptica ou através de qualquer outro meio que efectue ampla disseminação do mesmo.
Por exemplo, no caso de um sinal de difusão de televisão o sinal de vídeo é parametrizado de modo a produzir uma 2
ΕΡ 1 261 155 /PT sequência de dados digitais com uma palavra digital de 16 bits para cada quadro de video a qual, no sistema NTSC, ocorre em cada 1/30 de segundo. Será apreciado que intervalos de sinal diferentes, tais como campos de video, podem, pelo contrário, ser parametrizados desta forma. Estas palavras digitais são comparadas com palavras digitais que representam mensagens comerciais ou outros segmentos de interesse que são armazenados num dispositivo de armazenamento. Informação relativa a cada coincidência que é detectada entre as mesmas (o que indica que um segmento de interesse foi difundido) é recolhida.
De forma mais especifica, uma assinatura de chave digital é gerada para cada segmento conhecido (por exemplo, mensagem comercial) que se destina a ser reconhecido ou colocado em coincidência. A assinatura de chave, com vantagem, inclui oito palavras de 16 bits ou palavras de coincidência que são derivadas de oito quadros de informação difundida que são seleccionados de entre os quadros contidos no segmento desejado de acordo com um conjunto predeterminado de regras, em conjunto com informação de desvio que indica o espaçamento (medido, por exemplo, em quadros ou campos) entre a localização do quadro representado por cada palavra da assinatura e o representado pela primeira palavra do mesmo. No caso de um sinal de video, trinta e duas áreas predeterminadas do mesmo que compreendem, por exemplo, oito por dois pixéis de cada quadro (ou um campo seleccionado do mesmo que representa cada quadro) são seleccionadas, por exemplo. Um valor de luminância média para os pixéis de cada área é produzido e comparado com o valor de luminância média de uma área emparelhada com a mesma. O resultado desta comparação é normalizado para um valor de bit de um ou zero com base numa determinação se o valor de luminância média de uma primeira das áreas é (i) maior ou igual, ou (ii) inferior ao valor de luminância média da segunda das áreas. Desta forma, uma assinatura de quadro de dezasseis bits é produzida para cada um quadro do sinal de video.
Uma palavra máscara de dezasseis bits também é produzida para cada assinatura de quadro de dezasseis bits. Cada bit da palavra máscara representa a susceptibilidade ao ruido de um bit correspondente da assinatura de quadro e é produzido na 3
ΕΡ 1 261 155 /PT base da diferença entre os valores médios de luminância das áreas respectivas utilizadas para produzir o bit correspondente da assinatura de quadro. Isto é, se o valor absoluto da diferença entre estes valores médios de luminância for inferior a um valor de banda de guarda, o bit máscara correspondente é activado, o que indica susceptibilidade ao ruido.
As oito palavras de coincidência são seleccionadas das assinaturas de quadro de cada segmento descritas acima e armazenadas, em conjunto com as suas palavras máscara e informação de desvio, como parte da assinatura de chave para aquele segmento. 0 sinal recebido para ser reconhecido é digitalizado e uma assinatura de quadro de 16 bits é produzida na forma descrita acima para cada quadro (ou campo seleccionado) de dados. Depois dos sinais que chegam serem recebidos e processados, os mesmos são lidos para uma memória temporária que contém uma quantidade predeterminada de dados. Assume-se que cada assinatura de quadro de 16 bits do sinal que chega corresponde à primeira palavra de uma das assinaturas de chave de oito palavras previamente armazenadas. Como tal, cada palavra recebida é comparada com todas as assinaturas de chave que começam com aquela palavra. Utilizando a informação de desvio armazenada com as assinaturas, as subsequentes assinaturas de quadro recebidas (que já estão na memória temporária) são comparadas com as correspondentes palavras de coincidência na assinatura de chave para determinar se existe coincidência ou não.
De forma mais específica, cada palavra de coincidência da assinatura de chave é emparelhada com uma respectiva assinatura de quadro da assinatura recebida com base na informação de desvio e os bits correspondentes das palavras de coincidência emparelhadas e das assinaturas de quadro são comparados. Uma contagem total de erros é produzida com base nesta comparação como se segue. Se bits correspondentes da palavra de coincidência e da assinatura de quadro não dissimulados, então uma contagem de erro de zero é acumulada quando estes bits possuem o mesmo valor e uma contagem de erro de um é acumulada se estes bits diferirem em valor. Se 4
ΕΡ 1 261 155 /PT os bits forem dissimulados, então uma contagem de erro de um meio é acumulada por esse motivo apesar dos valores dos bits. Numa contagem total de erros é acumulada para todas as palavras de coincidência e assinaturas de quadro correspondentes e, se a contagem total de erros for inferior a um limiar de erro ou de defeito predeterminado, uma coincidência é determinada. Caso contrário, a coincidência não é determinada.
Como será apreciado, a fim de realizar o processamento exemplificativo acima em tempo real, todas as comparações deverão ser concluídas no tempo associado com cada quadro de dados, isto é, em 1/30 de um segundo. A velocidade de processamento tipica, associada a dispositivos de processamento normais, permite apenas que um número limitado de assinaturas de segmento seja armazenado e utilizado para comparação. A velocidade com que uma assinatura de chave pode ser comparada com uma assinatura de segmento para uma emissão recebida recentemente pode ser aumentada, de forma substancial, através da utilização de um método de redução de dados de pesquisa por palavra-chave. Neste método, um quadro é seleccionado dos quadros contidos no segmento correspondente à assinatura de chave, de acordo com um conjunto de critérios predeterminados. Este quadro seleccionado é um quadro de chave e a assinatura de quadro associada ao mesmo é a palavra-chave. A assinatura de chave possui ainda, de preferência, oito palavras de 16 bits, no entanto, a informação de desvio relativa à mesma agora representa o espaçamento da palavra-chave, em vez de um espaçamento da primeira palavra na assinatura de chave. A palavra-chave pode ser uma das palavras de assinatura de chave na assinatura de chave, em cuja situação o desvio para aquela palavra possui um valor de O, ou pode ser uma nona palavra. A localização de quadro da palavra-chave não necessita de preceder temporariamente as localizações de quadro de todas as outras palavras de coincidência na assinatura de chave. 5
ΕΡ 1 261 155 /PT
Existem múltiplas assinaturas de chave associadas a cada palavra-chave. Como um exemplo, se forem utilizadas palavras de 16 bits e se quatro assinaturas de chave estiverem associadas a cada palavra-chave, então quatro comparações de assinatura completas seriam o número máximo que teria de ser realizado no 1/30 de um segundo limite de tempo (assumindo que não existem erros de dados). Este número de comparações é facilmente realizado no limite de tempo.
Deseja-se alcançar a mais elevada precisão possível no reconhecimento de segmentos de difusão, bem como a maior eficiência possível. No entanto, ocorre um número de problemas na concretização de uma técnica deste tipo. Por exemplo, os sinais de difusão são sujeitos a desvios no tempo tais como um desvio na margem de uma imagem de vídeo que ocorre de tempo a tempo. Sinais de vídeo também são sujeitos a instabilidade. Cada um destes efeitos irá afectar de forma adversa uma técnica de reconhecimento de segmentos que se baseia na amostragem de porções predeterminadas do sinal de vídeo, salvo se esses efeitos forem de algum modo compensados.
Uma dificuldade adicional que ocorre na concretização de reconhecimento de segmentos de difusão com base em sinais de vídeo é que as assinaturas que os mesmos geram tendem a ser distribuídas de forma não uniforme em valor devido às semelhanças entre sinais de vídeo de segmentos diferentes. Consequentemente, as assinaturas de vídeo tendem a ser distribuídas de forma não uniforme de modo que números relativamente grandes de assinaturas tendem a possuir valores semelhantes e são, deste modo, predispostos a coincidência falsa (isto é, indicarem uma coincidência entre assinaturas que representam segmentos diferentes) .
Até agora, tem sido considerado impraticável concretizar reconhecimento de padrões de segmentos de difusão áudio devido às dificuldades encontradas na extracção de informação suficiente dos sinais áudio. Por exemplo, sinais áudio de televisão são predominantemente sinais de voz que estão concentrados abaixo aproximadamente de 3.000 Hz e possuem espectros de frequência muito semelhantes de um segmento até ao seguinte. 6
ΕΡ 1 261 155 /PT
Devido aos efeitos anteriores, bem como a ruído de sinal, é difícil implementar uma técnica de reconhecimento de padrões para identificação de segmentos de difusão que possua elevada precisão. Isto é, as possibilidades que assinaturas de segmentos produzam coincidência falsa ou falhem em proporcionar uma coincidência completamente fiável tendem a limitar a precisão de uma técnica deste tipo. Quando, por exemplo, segmentos conhecidos não são identificados pelo sistema de reconhecimento de padrões, os mesmos podem ser transmitidos para um operador de estação de trabalho para identificação como potenciais novos segmentos, quando de facto os mesmos o não são. 0 resultado é que o tempo do operador de estação de trabalho é desperdiçado e a eficiência do sistema degrada-se. Por outro lado, se segmentos novos forem identificados quando de facto os mesmos não são segmentos de interesse, o tempo do operador de estação de trabalho pode também ser desperdiçado numa tentativa inútil de identificar estes segmentos. Por exemplo, num sistema de reconhecimento de mensagens comerciais televisivas, é necessário distinguir mensagens comerciais televisivas de programação normal, actualizações de noticiários, anúncios de serviço público, etc. É, por conseguinte, desejável garantir que o maior número de segmentos novos proporcionados aos operadores de estações de trabalho para identificação são de facto segmentos de interesse. Uma dificuldade adicional ocorre quando segmentos novos de interesse são separados de forma incorrecta, de modo que apenas porções de segmentos novos são reportadas aos operadores das estações de trabalho que podem evitar a correcta identificação do segmento o que também desperdiça o tempo do operador.
Em US 3919479 é descrito um sistema de identificação de sinais de difusão. Em FR 2559002 é descrito um método e um aparelho para identificação de difusão de informação áudio visual emitida em rádio ou TV. Em W088/10540 é descrito um sistema e método de classificação de informação emitida através da geração de espectogramas para comparação com os espectogramas de referência. Em US 4,230,990 é descrito um método de identificação de programas de difusão através da utilização de sinais de activação difundidos com programas, e/ou através da extracção de assinaturas por análise da 7
ΕΡ 1 261 155 /PT composição espectral de porções de áudio de um sinal de programa.
OBJECTOS E SUMÁRIO DO INVENTO É um objecto do presente invento proporcionar métodos e aparelho para utilização em reconhecimento de segmentos de difusão e semelhantes, que proporcionam precisão de reconhecimento e eficiência do sistema melhoradas. 0 presente invento proporciona um método e um sistema para produção de uma assinatura a partir de um sinal de difusão áudio de acordo com as reivindicações 1 e 7. 0 método pode compreender a produção de uma assinatura a partir de um sinal de difusão áudio para utilização no reconhecimento de sinais de difusão, que compreende os passos de: formação de uma pluralidade de valores de banda de frequências em que cada um representa porções do dito sinal de difusão áudio nas respectivas bandas de frequência predeterminadas; comparação de cada um de um primeiro grupo da dita pluralidade de valores de banda de frequências com um respectivo valor de um segundo grupo da dita pluralidade de valores de banda de frequências que representam porções do dito sinal de difusão áudio na mesma respectiva banda de frequências predeterminada, em que cada respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências representa porções do dito sinal de difusão áudio em que, pelo menos, uma parte das quais foram difundidas antes das porções do dito sinal de difusão áudio representado pelo correspondente valor do dito primeiro grupo da dita pluralidade de valores de banda de frequências; e formação da dita assinatura com base nas comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências.
Na concretização do método prefere-se que os passos de formação de uma pluralidade de valores de banda de frequências compreendam a formação de primeiros sinais de banda de frequências representando cada um uma caracteristica do dito sinal de difusão áudio numa respectiva banda das ditas bandas de frequência predeterminadas e a transformação 8 ΕΡ 1 261 155 /PT de cada um dos ditos primeiros sinais de banda de frequências num valor correspondente da dita pluralidade de valores de banda de frequências com base em, pelo menos, um outro primeiro sinal de banda de frequências. De preferência também, o passo de formação dos ditos primeiros sinais de banda de frequências compreende a formação de uma pluralidade de sinais de nivel de potência em que cada um representa um nivel de potência do dito sinal de difusão áudio numa respectiva banda das ditas bandas de frequência predeterminadas e o passo de transformação dos ditos primeiros sinais de banda de frequências compreende a divisão de cada um da dita pluralidade de sinais de nivel de potência por uma combinação linear de outros dos ditos primeiros sinais de banda de frequências. É também proporcionado um sistema para produção de uma assinatura que caracteriza um sinal de difusão áudio para utilização no reconhecimento de sinais de difusão, que compreende: meios para formação de uma pluralidade de valores de banda de frequências em que cada um representa porções do dito sinal de difusão áudio nas respectivas bandas de frequência predeterminadas; meios para comparação de cada um de um primeiro grupo da dita pluralidade de sinais de banda de frequências com um respectivo valor de um segundo grupo da dita pluralidade de valores de banda de frequências que representam porções do dito sinal de difusão áudio na mesma respectiva banda de frequências predeterminada, em que cada respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências representa porções do dito sinal de difusão áudio em que, pelo menos, uma parte das quais foi difundida antes das porções do dito sinal de difusão áudio representado pelo valor correspondente do dito primeiro grupo da dita pluralidade de valores de banda de frequências; e meios para formação da dita assinatura com base nas comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências. É também proporcionado um método de produção de uma assinatura que caracteriza um intervalo de um sinal de video que representa uma figura para utilização no reconhecimento de segmentos de difusão, em que a assinatura é produzida com base em porções do sinal de vídeo que representam regiões 9 ΕΡ 1 261 155 /PT correspondentes da figura cada uma espaçada de uma respectiva quantidade predeterminada de uma margem nominal da figura, que compreende os passos de: detecção de um desvio no sinal de video correspondente com um desvio na margem da figura a partir da margem nominal da mesma; ajuste das porções do sinal de video para compensar o dito desvio na margem da figura; e produção da assinatura com base nas porções ajustadas do sinal de video.
Na concretização de um método de acordo com o último parágrafo anterior, prefere-se que o passo de detecção de um desvio no sinal de video compreenda a amostragem de uma porção predeterminada do sinal de video correspondente com a margem nominal da figura e, pelo menos, com uma região adjacente da mesma; detecção de uma diferença entre os valores do sinal de video espaçado na porção predeterminada do sinal de video ao longo de uma direcção, de um modo geral, transversal a uma direcção da margem nominal da figura para detectar uma margem real da figura; e determinação do desvio na margem da figura com base na margem real detectada da mesma. De preferência, os passos de detecção de um desvio no sinal de video compreendem a amostragem de uma pluralidade de porções predeterminadas do sinal de video correspondente com a margem nominal da figura e, pelo menos, uma região adjacente da mesma; detecção das diferenças respectivas entre valores do sinal de video espaçados em cada uma da pluralidade de porções predeterminadas ao longo de uma direcção de um modo geral transversal a uma direcção da margem nominal da figura; e utilização de cada uma das diferenças respectivas para detectar a margem real da figura. 0 passo de detecção de um desvio no sinal de video pode compreender a amostragem da dita porção predeterminada do sinal de video para produzir uma pluralidade de valores de pixel em que cada um dos quais está espaçado de um que corresponde a outro valor do mesmo ao longo de uma direcção de um modo geral transversal à margem nominal da figura; detecção de uma diferença no valor entre, pelo menos, um dos valores de pixel e o que corresponde a outro valor do mesmo para detectar uma margem real da figura; e determinação do desvio na margem da figura com base na margem real detectada da mesma. 10
ΕΡ 1 261 155 /PT
Na concretização de um método de acordo com o último parágrafo anterior, o, pelo menos, um dos valores de pixel e o outro correspondente ao mesmo podem ser, de um modo geral, espaçados ao longo da direcção transversal de, pelo menos, dois intervalos de pixel. É também proporcionado um sistema para produção de uma assinatura que caracteriza um intervalo de um sinal de video que representa uma figura para utilização no reconhecimento de segmentos de difusão em que a assinatura é produzida com base em porções do sinal de video que representam regiões correspondentes da figura cada uma espaçada de uma respectiva quantidade predeterminada a partir de uma margem nominal da figura, que compreende: meios para detecção de um desvio no sinal de video correspondente com um desvio na margem da figura a partir da margem nominal da mesma; meios para ajuste das porções do sinal de video para compensar o dito desvio na margem da figura; e meios para produção da assinatura com base nas porções ajustadas do sinal de video. É também proporcionado um método de produção de assinaturas que caracterizam intervalos respectivos de um sinal de difusão que exibe correlação entre, pelo menos, alguns dos ditos intervalos respectivos para utilização no reconhecimento do segmento de difusão, que compreende os passos de: produção de um vector diferença para cada respectivo intervalo do dito sinal de difusão com uma pluralidade de elementos em que cada um representa diferenças entre porções respectivas predeterminadas de cada um do dito respectivo intervalo e que exibem correlação entre os mesmos; concretização de uma transformação vectorial do dito vector diferença de cada respectivo intervalo para produzir um vector diferença transformado com uma pluralidade de elementos para cada respectivo intervalo do dito sinal de difusão tal que a correlação entre a pluralidade de elementos do mesmo é inferior à correlação entre a pluralidade de elementos do dito vector diferença; e produção de uma assinatura para cada respectivo intervalo do dito sinal de difusão com base no correspondente vector diferença transformado. 11
ΕΡ 1 261 155 /PT
Na concretização de um método de acordo com o último parágrafo anterior, o passo de concretização de uma transformação vectorial do dito vector diferença pode compreender a concretização de uma transformada de Hotelling do mesmo. Para além disso o método pode compreender o passo de formação de primeiro e segundo grupos de vectores diferença, compreendendo o primeiro grupo vectores diferença que formam assinaturas com valores de ocorrência relativamente frequentes e compreendendo o segundo grupo vectores diferença que formam assinaturas com valores que ocorrem com menos frequência do que o segundo grupo, e em que o passo de concretização da dita transformação vectorial compreende a concretização de uma primeira transformação vectorial para vectores diferença do dito primeiro grupo e uma segunda transformação para vectores diferença do dito segundo grupo. Os passos de concretização das primeira e segunda transformações podem compreender a concretização das respectivas transformadas de Hotelling que utilizam valores de transformação correspondentes com base em vectores diferença recebidos previamente que ficam em grupos sujeitos às respectivas transformadas de Hotelling. Para além disso, o passo de produção de um vector diferença para cada respectivo intervalo do dito sinal de difusão pode compreender a formação de um vector diferença para cada um de uma pluralidade de intervalos de um sinal de difusão video com base em porções do sinal de video que representam as regiões correspondentes de uma figura. É também proporcionado um sistema para produção de assinaturas que caracterizam intervalos respectivos de um sinal de difusão que exibem correlação entre, pelo menos, alguns dos ditos intervalos respectivos para utilização no reconhecimento de segmentos de difusão que compreendem: meios para produção de um vector diferença para cada respectivo intervalo do dito sinal de difusão com uma pluralidade de elementos em que cada um representa diferenças entre as respectivas porções predeterminadas do dito respectivo intervalo e que exibem correlação entre as mesmas; meios para concretização de uma transformação vectorial do dito vector diferença de cada respectivo intervalo para produzir um vector diferença transformado com uma pluralidade de elementos para cada respectivo intervalo do dito sinal de 12
ΕΡ 1 261 155 /PT difusão tal que a correlação entre a pluralidade de elementos do mesmo é inferior à correlação entre a pluralidade de elementos do dito vector diferença; e meios para produção de uma assinatura para cada respectivo intervalo do dito sinal de difusão com base no correspondente vector diferença transformado.
Além disso, é proporcionado um método de produção de uma assinatura que caracteriza um intervalo de um sinal de video que representa uma figura para utilização no reconhecimento de segmentos de difusão, em que a assinatura é produzida com base em porções do sinal de video que representam correspondentes regiões da figura e para produção de uma correspondente palavra máscara que inclui uma pluralidade de valores de bit em que cada um representa uma fiabilidade de um valor correspondente da assinatura, que compreende os passos de: formação de uma primeira assinatura com uma pluralidade de valores cada um com base nos respectivos valores das ditas porções do sinal de video; formação de uma segunda assinatura com uma pluralidade de valores cada um com base nos valores respectivos de uma pluralidade de porções desviadas do sinal de video em que cada uma correspondente a uma porção respectiva das ditas porções e com uma localização deslocada de uma localização da dita porção respectiva das ditas porções por uma quantidade predeterminada, tal que cada valor da dita primeira assinatura corresponde a um valor da segunda assinatura; comparação de valores respectivos das ditas primeira e segunda assinaturas; estabelecimento dos ditos valores de bit da dita palavra máscara com base na comparação de um respectivo valor da dita primeira assinatura com o valor correspondente da segunda assinatura. 0 passo de estabelecimento dos ditos valores de bit da dita palavra máscara pode também compreender o estabelecimento de um primeiro valor binário do mesmo se o valor correspondente da dita primeira assinatura for, de forma substancial, igual ao respectivo valor da segunda assinatura, e estabelecimento de um segundo valor binário se o valor correspondente da dita primeira assinatura não for, de forma substancial, igual ao respectivo valor da segunda assinatura. É também proporcionado um sistema para produção de uma assinatura que caracteriza um intervalo de um sinal de vídeo 13
ΕΡ 1 261 155 /PT que representa uma figura para utilização no reconhecimento de segmentos de difusão, em que a assinatura é produzida com base em porções do sinal de vídeo em que cada uma representa uma região correspondente da figura e para produção de uma correspondente palavra máscara que inclui uma pluralidade de valores de bit em que cada uma representa uma fiabilidade de um valor correspondente da assinatura, que compreende meios para formação de uma primeira assinatura com uma pluralidade de valores cada um com base nos valores respectivos das ditas porções do sinal de vídeo; meios para formação de uma segunda assinatura com uma pluralidade de valores cada um com base nos valores respectivos de uma pluralidade de porções deslocadas do sinal de vídeo em que cada uma corresponde a uma porção respectiva das ditas porções e com uma localização deslocada de uma localização da dita porção respectiva das ditas porções por uma quantidade predeterminada, tal que cada valor da dita primeira assinatura corresponde a um valor da segunda assinatura; meios para comparação dos valores respectivos das ditas primeira e segunda assinaturas; e meios para estabelecer os ditos valores de bit da dita palavra máscara com base na comparação de um respectivo valor da dita primeira assinatura com o valor correspondente da segunda assinatura. É proporcionado um método de produção de uma assinatura que caracteriza um intervalo de sinal de difusão para utilização no reconhecimento de segmentos de difusão com uma base de dados de assinaturas, incluindo a assinatura de uma pluralidade de palavras digitais em que cada uma caracteriza um respectivo sub-intervalo do dito intervalo do sinal de difusão, que compreende os passos de: divisão do intervalo do sinal de difusão numa pluralidade de sub-intervalos; formação de uma pluralidade de palavras digitais em que cada uma caracteriza a dita pluralidade de sub-intervalos; e selecção de, pelo menos, uma da pluralidade de palavras digitais que caracterizam cada sub-intervalo com base em, pelo menos, um dos seguintes factores: (a) uma distribuição de palavras digitais geradas previamente que caracterizam sinais de difusão; (b) uma distribuição de palavras digitais de assinaturas geradas previamente armazenadas na base de dados de assinaturas; (c) uma probabilidade de, pelo menos, uma da pluralidade de palavras digitais corresponder a uma palavra 14
ΕΡ 1 261 155 /PT digital que caracteriza um sub-intervalo correspondente após a redifusão do sub-intervalo; e (d) um grau de diferença de sinal entre o sub-intervalo correspondente com a, pelo menos, uma da pluralidade de palavras digitais e porções adjacentes do intervalo do sinal de difusão. 0 passo de selecção de, pelo menos, uma da pluralidade de palavras digitais pode compreender a selecção da dita, pelo menos, uma da pluralidade de palavras digitais com base na (a) dita distribuição de palavras digitais geradas previamente que caracterizam sinais de difusão e/ou (b) dita distribuição de palavras digitais de assinaturas geradas previamente armazenados na base de dados de assinaturas e/ou (c) dita probabilidade da, pelo menos, uma da pluralidade de palavras digitais corresponder a uma palavra digital que caracteriza um sub-intervalo correspondente após redifusão do sub-intervalo, e/ou (d) dito grau de diferença de sinal entre o sub-intervalo correspondente com a, pelo menos, uma da pluralidade de palavras digitais e porções adjacentes do intervalo do sinal de difusão. 0 passo de selecção de, pelo menos, uma da pluralidade de palavras digitais correspondentes compreender a atribuição de valores respectivos a, pelo menos, dois dos ditos factores, formação de uma combinação linear dos ditos valores respectivos para produzir um valor combinado e selecção da dita, pelo menos, uma da pluralidade de palavras digitais com base no dito valor combinado.
Para além disso, é proporcionado um sistema para produção de uma assinatura que caracteriza um intervalo do sinal de difusão para utilização no reconhecimento de segmentos de difusão com uma base de dados de assinaturas, incluindo a assinatura de uma pluralidade de palavras digitais em que cada uma caracteriza um respectivo sub-intervalo do dito intervalo do sinal de difusão, que compreende; meios para divisão do intervalo do sinal de difusão numa pluralidade de sub-intervalos; meios para formação de uma pluralidade de palavras digitais em que cada uma caracteriza a dita pluralidade de sub-intervalos; e meios para selecção de, pelo menos, uma da pluralidade de palavras digitais que caracterizam cada sub-intervalo com base em, pelo menos, um dos seguintes factores: (a) uma distribuição de palavras digitais geradas previamente que caracterizam 15
ΕΡ 1 261 155 /PT sinais de difusão; (b) uma distribuição de palavras digitais de assinaturas geradas previamente armazenadas na base de dados de assinaturas; (c) uma probabilidade que a, pelo menos, uma da pluralidade de palavras digitais corresponda a uma palavra digital que caracteriza um sub-intervalo correspondente após a redifusão do sub-intervalo; e (d) um grau de diferença de sinal entre o sub-intervalo correspondente com o, pelo menos, um da pluralidade de palavras digitais e porções adjacentes do intervalo do sinal de difusão.
Consequentemente, podem ser proporcionados um método e um sistema de reconhecimento de segmentos de difusão que compreendem meios para e os passos de, respectivamente, produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão para serem reconhecidos; armazenamento de cada dita assinatura para formar uma base de dados de assinaturas de segmentos difundidos; monitorização de um segmento de difusão, formação de uma assinatura que representa o segmento de difusão monitorizado; comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma das assinaturas de segmentos de difusão da base de dados para determinar se existe uma coincidência entre as mesmas; e avaliação da validade de uma coincidência de um segmento de difusão monitorizado por concretização de, pelo menos, um de: (a) determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados; (b) determinação se o segmento de difusão monitorizado se sobrepõe a qualquer outro segmento de difusão monitorizado para o qual uma coincidência tenha sido aceite de acordo com critérios predeterminados; e (c) determinação se a coincidência está conforme com um perfil predeterminado de segmentos de falsa coincidência.
Um sistema e um método para reconhecimento de segmentos de difusão são proporcionados que compreendem meios para e os passos de, respectivamente, produção de uma assinatura para cada um da pluralidade de segmentos de difusão para serem reconhecidos; armazenamento de cada dita assinatura para formar uma base de dados de assinaturas de segmentos de difusão; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão 16 ΕΡ 1 261 155 /PT monitorizado; comparação da assinatura que representa o segmento de difusão monitorizado com cada uma de uma pluralidade de assinaturas de segmentos de difusão da base de dados para determinar se existe uma coincidência entre as mesmas de acordo com um primeiro nivel de tolerância de erro; avaliação se a coincidência fica numa classe de coincidências de aceitação questionável com base em critérios de avaliação predeterminados; e, se a coincidência fica na dita classe de coincidências de aceitação questionável, comparação da assinatura que representa o segmento de difusão monitorizado com a assinatura do segmento de difusão correspondente da base de dados através da utilização de um segundo nivel de tolerância de erro que aceita coincidências com níveis de erro relativamente mais elevados do que coincidências aceitáveis de acordo com o primeiro nível de tolerância de erro.
Um sistema e um método de produção de uma assinatura que caracteriza um sinal de difusão áudio para utilização no reconhecimento de sinais de difusão, compreendem os meios para e os passos de, respectivamente, formação de uma pluralidade de valores de banda de frequências em que cada um representa porções do dito sinal de difusão áudio nas respectivas bandas de frequência predeterminadas; comparação de cada um de um primeiro grupo da dita pluralidade de valores de banda de frequências com um respectivo valor de um segundo grupo da dita pluralidade de valores de banda de frequências que representam porções do dito sinal de difusão áudio na mesma respectiva banda de frequências predeterminada, representando cada respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências porções do dito sinal de difusão áudio em que, pelo menos, uma parte do qual foi difundida antes das porções do dito sinal de difusão áudio representada pela correspondente do dito primeiro grupo da dita pluralidade de valores de banda de frequências; e formação da dita assinatura com base nas comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências. São proporcionados um sistema e um método para produção de uma assinatura que caracteriza um intervalo de um sinal de 17 ΕΡ 1 261 155 /PT vídeo que representa uma figura para utilização no reconhecimento de segmentos de difusão, em que a assinatura é produzida com base em porções do sinal de vídeo que representam regiões correspondentes da figura cada uma espaçada de uma respectiva quantidade predeterminada de uma margem nominal da figura, que compreendem os meios para e os passos de, respectivamente, detecção de um deslocamento no sinal de vídeo correspondente com um deslocamento na margem da figura a partir da margem nominal da mesma; ajuste das porções do sinal de vídeo para compensar o dito deslocamento na margem da figura; e produção da assinatura com base nas porções ajustadas do sinal de vídeo. São proporcionados um sistema e um método para produção de assinaturas que caracterizam intervalos respectivos de um sinal de difusão que exibem correlação entre, pelo menos, alguns dos ditos intervalos respectivos para utilização no reconhecimento de segmentos de difusão, que compreendem os meios para e os passos de, respectivamente, produção de um vector diferença para cada respectivo intervalo do dito sinal de difusão com uma pluralidade de elementos representando cada um diferenças entre porções predeterminadas respectivas de cada dito respectivo intervalo e que exibem correlação entre si; concretização de uma transformação vectorial do dito vector diferença de cada respectivo intervalo para produzir um vector diferença transformado com uma pluralidade de elementos para cada respectivo intervalo do dito sinal de difusão tal que a correlação entre a pluralidade de elementos do mesmo é inferior à correlação entre a pluralidade de elementos do dito vector diferença; e produção de uma assinatura para cada respectivo intervalo do dito sinal de difusão com base no correspondente vector diferença transformado. São proporcionados um sistema e um método para produção de uma assinatura que caracteriza um intervalo de um sinal de vídeo que representa uma figura para utilização no reconhecimento de segmentos de difusão, em que a assinatura é produzida com base em porções do sinal de vídeo que representam regiões correspondentes da figura, e para produção de uma correspondente palavra máscara que inclui uma pluralidade de valores de bit em que cada um representa uma 18
ΕΡ 1 261 155 /PT fiabilidade de um valor correspondente da assinatura, que compreendem os meios para e os passos de, respectivamente, formação de uma primeira assinatura com uma pluralidade de valores cada um com base nos valores respectivos das ditas porções do sinal de video; formação de uma segunda assinatura com uma pluralidade de valores cada um com base nos valores respectivos de uma pluralidade de porções deslocadas do sinal de video correspondendo cada um a uma porção respectiva das ditas porções e com uma localização deslocada de uma localização da dita porção respectiva das ditas porções de uma quantidade predeterminada, tal que cada valor da dita primeira assinatura corresponde a um valor da segunda assinatura; comparação de valores respectivos das ditas primeira e segunda assinaturas; estabelecimento dos ditos valores de bit da dita palavra máscara com base na comparação de um respectivo valor da dita primeira assinatura com o valor correspondente da segunda assinatura. São proporcionados um sistema e um método para actualização de uma base de dados de reconhecimento de segmentos de difusão que armazenam assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreendem os meios para e os passos de, respectivamente, monitorização de um sinal de difusão para detectar eventos de sinal predeterminados que assinalam possiveis segmentos de difusão de interesse correspondentes com intervalos de sinais de difusão monitorizados respectivos; determinação se, pelo menos, dois possiveis segmentos de difusão alternativos de interesse são detectados para um intervalo do sinal de difusão monitorizado; atribuição de prioridade a um dos ditos, pelo menos, dois segmentos de difusão possiveis alternativos de interesse com base em critérios predeterminados; e armazenamento de uma assinatura na base de dados correspondente com a prioridade atribuída aos ditos, pelo menos, dois segmentos de difusão possíveis alternativos de interesse. São proporcionados um sistema e um método para actualização de uma base de dados de reconhecimento de segmentos de difusão que armazena assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreendem os meios para e os passos de, respectivamente, 19
ΕΡ 1 261 155 /PT monitorização de um sinal de difusão para detectar eventos de sinal predeterminados que assinalam possíveis segmentos de difusão de interesse correspondentes com respectivos intervalos de sinais de difusão monitorizados; determinação da extensão em que os respectivos intervalos de sinais de difusão monitorizados se desviam de intervalos predeterminados do sinal de difusão de possíveis segmentos de difusão de interesse; selecção dos ditos respectivos intervalos de sinais de difusão monitorizados como segmentos novos de interesse com base na extensão de desvio determinada dos mesmos a partir dos ditos comprimentos padrão de segmentos de difusão de interesse; e armazenamento de uma assinatura na base de dados correspondente com os seleccionados dos respectivos intervalos de sinais de difusão monitorizados. São proporcionados um sistema e um método para captura selectiva de, pelo menos, um de um sinal de difusão áudio e de um sinal de difusão vídeo para utilização na actualização de uma base de dados de reconhecimento de segmentos de difusão que armazena assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreendem os meios para e os passos de, respectivamente, armazenar de forma temporária, pelo menos, um de um sinal de difusão áudio e de um sinal de difusão vídeo de uma emissão monitorizada; detecção de eventos de sinal predeterminados que assinalam possíveis segmentos novos de difusão de interesse da emissão monitorizada; selecção de intervalos da emissão monitorizada como possíveis segmentos novos de difusão de interesse com base nos ditos eventos de sinal predeterminados; atribuição de um primeiro nível de captura a um primeiro intervalo seleccionado com base em características predeterminadas do mesmo que assinalam que o dito primeiro intervalo seleccionado é provavelmente um novo segmento de interesse; atribuição de um segundo, nível de captura a um segundo intervalo seleccionado com base em características predeterminadas do mesmo que assinalam que o segundo intervalo seleccionado é relativamente menos provável do que o primeiro intervalo seleccionado para ser um novo segmento de interesse; armazenamento de uma assinatura correspondente com o primeiro intervalo seleccionado na base de dados e captura de, pelo menos, um dos sinais de vídeo e 20
ΕΡ 1 261 155 /PT áudio temporariamente armazenados correspondentes com o primeiro intervalo seleccionado para transmissão a um operador de estação de trabalho para identificação de segmento; armazenamento de uma assinatura correspondente com o segundo intervalo seleccionado na base de dados; e eliminação do sinal de difusão video e áudio armazenado temporariamente dos sinais de difusão video e áudio correspondente com o segundo intervalo seleccionado. São proporcionados um sistema e um método para produção de uma assinatura que caracteriza um intervalo do sinal de difusão para utilização no reconhecimento de segmentos de difusão com uma base de dados de assinaturas, incluindo a assinatura de uma pluralidade de palavras digitais em que cada um caracteriza um respectivo sub-intervalo do dito intervalo do sinal de difusão, que compreendem os meios para e os passos de, respectivamente, divisão do intervalo do sinal de difusão numa pluralidade de sub-intervalos; formação de uma pluralidade de palavras digitais em que cada uma caracteriza a dita pluralidade de sub-intervalos; e selecção de, pelo menos, uma da pluralidade de palavras digitais em que cada uma caracteriza sub-intervalos com base em, pelo menos, um dos seguintes factores: (a) uma distribuição de palavras digitais geradas previamente que caracterizam sinais de difusão; (b) uma distribuição de palavras digitais de assinaturas geradas previamente armazenadas numa base de dados de assinaturas; (c) uma probabilidade que a, pelo menos, uma da pluralidade de palavras digitais corresponda com uma palavra digital que caracteriza um sub-intervalo correspondente após redifusão do sub-intervalo; e (d) um grau de diferença de sinal entre os sub-intervalos correspondentes com a, pelo menos, uma da pluralidade de palavras digitais e porções adjacentes do intervalo do sinal de difusão. São proporcionados um sistema e um método para reconhecimento de segmentos de difusão, que compreendem os meios para e os passos de, respectivamente, produção de uma assinatura para cada um da pluralidade de segmentos de difusão que se destinam a ser reconhecidos; para cada assinatura produzida, determinação de uma probabilidade que esta assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de 21
ΕΡ 1 261 155 /PT difusão e produção de uma probabilidade correspondente com base no critério para utilização na avaliação de uma coincidência da assinatura produzida; armazenamento de cada assinatura produzida e da sua probabilidade correspondente com base no critério para formar uma base de dados; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão monitorizado; comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados para determinar uma coincidência da mesma; e determinação de aceitação da dita coincidência com base na probabilidade correspondente segundo o critério. São proporcionados um sistema e um método para reconhecimento de segmentos de difusão, que compreendem os meios para e os passos de, respectivamente, produção de uma assinatura digital para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos, em que cada dita assinatura digital inclui uma pluralidade de valores de bit que caracterizam um segmento correspondente da dita pluralidade de segmentos de difusão; para cada assinatura digital produzida, determinação de um número provável de valores de bit da mesma que correspondem com os valores de bit de uma assinatura digital produzida após redifusão do correspondente segmento de difusão e produção de uma probabilidade correspondente com base no valor de coincidência para utilização na determinação se cada dita assinatura digital produzida corresponde com uma assinatura digital de um segmento de difusão recebido subsequentemente; armazenamento de cada assinatura produzida e da sua probabilidade correspondente com base no valor de coincidência para formar uma base de dados; monitorização de um segmento de difusão; formação de uma assinatura digital com uma pluralidade de valores de bit que representam o segmento de difusão monitorizado; comparação da assinatura digital que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura digital armazenada na base de dados; e determinação se a assinatura digital que representa o segmento de difusão monitorizado corresponde a, pelo menos, uma assinatura digital através da utilização da probabilidade correspondente com base no valor de coincidência. 22
ΕΡ 1 261 155 /PT
Finalmente, são proporcionados um sistema e um método para reconhecimento de segmentos de difusão, que compreendem os meios para e os passos de, respectivamente, produção de uma assinatura para cada um da pluralidade de segmentos de difusão que se destinam a ser reconhecidos; para cada assinatura produzida, determinação de uma probabilidade que esta assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão; produção de uma assinatura adicional para cada um da dita pluralidade de segmentos de difusão que se destinam a ser reconhecidos quando a dita probabilidade que a dita assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão é inferior a um valor predeterminado; armazenamento de cada assinatura produzida para formar uma base de dados; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão monitorizado; e comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados.
Outros objectos, caracteristicas e vantagens do presente invento ficarão evidentes da seguinte descrição detalhada das concretizações ilustrativas quando lidas em conjunto com os desenhos em anexo em que componentes correspondentes estão identificados pelos mesmos números de referência.
BREVE DESCRIÇÃO DOS DESENHOS A Fig. 1 ilustra um sistema para monitorizar uma sequência continua de sinais de difusão; a Fig. 2 é um diagrama de um dos sítios locais no sistema mostrado na Fig. 1; a Fig. 3 é um diagrama que ilustra fluxos de sinal no sítio local da Fig. 2 durante uma operação de coincidência; a Fig. 4 é um diagrama utilizado para explicar um método para formação de uma assinatura de quadro de vídeo; 23
ΕΡ 1 261 155 /PT as Fig. 5A e 5B ilustram uma porção de um quadro de vídeo com uma condição de margem normal e uma condição de margem deslocada, respectivamente; a Fig. 6 é um diagrama ao qual se faz referência na explicação de uma técnica de máscara anti-instabilidade; as Figs. 7A e 7B são diagramas de blocos que ilustram um sistema de geração de assinaturas áudio; a Fig. 8 é um diagrama ao qual se faz referência na explicação da operação da montagem de geração de assinaturas áudio das Figs. 7A e 7B; a Fig. 9 é um fluxograma para explicação de uma técnica de filtragem de ocorrência; a Fig. 10 é um diagrama para explicação de uma técnica de confirmação de coincidência; a Fig. 11 é um diagrama que ilustra fluxos de sinal no sítio local da Fig. 2 quando se detecta um novo segmento de interesse; a Fig. 12 ilustra uma sequência de passos realizados na detecção de novos segmentos de interesse de acordo com um primeiro modo de operação; a Fig. 13 ilustra uma sequência de passos realizados na detecção de novos segmentos de interesse de acordo com um segundo modo de operação; a Fig. 14 ilustra uma sequência de passos realizados na detecção de novos segmentos de interesse de acordo com um terceiro modo de operação; a Fig. 15 é um diagrama em árvore utilizado para descrever o processo ilustrado na Fig. 14; a Fig. 16 é um diagrama que ilustra fluxos de sinal no sítio local da Fig. 2 durante a captura de dados áudio e vídeo; 24
ΕΡ 1 261 155 /PT a Fig. 17 é um diagrama que ilustra fluxos de sinal no sitio local da Fig. 2 durante a geração de assinaturas de chave; e a Fig. 18 é um fluxograma que ilustra passos realizados na geração de assinaturas de chave.
DESCRIÇÃO DETALHADA DAS CONCRETIZAÇÕES PREFERIDAS A Fig. 1 ilustra um sistema 10 para monitorizar uma sequência continua de sinais de difusão de televisão e proporcionar informação de reconhecimento à qual podem ser aplicadas as concretizações do presente invento. Como mostrado aqui, o sistema 10, de um modo geral, compreende um sitio central 12, uma ou mais estações de trabalho 14 localizadas no sitio central 12, e um ou mais sítios locais 16. Cada um dos sítios locais 16 monitoriza a emissão numa região geográfica correspondente. O sítio central 12 comunica com cada um dos sítios locais 16, por exemplo, através de linhas telefónicas, para receber dados relativos à detecção de segmentos de difusão conhecidos e potencialmente novos, segmentos desconhecidos e proporcionar informação de detecção e assinaturas de segmento correspondente aos novos segmentos de difusão. O sítio central 12 compila os dados recebidos e formula os mesmos num relatório 13 que, por exemplo, pode ser fornecido a anunciantes de difusão. O sítio central 12 também fornece dados de difusão, por exemplo, dados áudio e vídeo, às estações de trabalho 14 onde segmentos novos e desconhecidos são identificados por operadores humanos e é atribuído aos mesmos um código de identificação. Se um sítio identifica uma porção de uma emissão como um novo segmento de interesse (tal como uma mensagem comercial), quando o mesmo é de facto algo mais (tal como programação normal), o tempo do operador de estação de trabalho para identificar o segmento indesejado é desperdiçado. Também, se um segmento já conhecido não puder ser correctamente identificado pelo sistema 10, o mesmo pode ser relatado de forma incorrecta pelo sítio central 12 para uma estação de trabalho 14 como um segmento novo, 25
ΕΡ 1 261 155 /PT desperdiçando, deste modo, mais tempo do operador. 0 custo de empregar operadores é uma despesa permanente significativa. Consequentemente, é desejável minimizar este custo através da detecção precisa de segmentos novos de interesse e da identificação de segmentos conhecidos. 0 presente invento proporciona métodos e aparelho melhorados para reconhecimento de sinal que atingem uma capacidade melhorada de identificar de forma precisa segmentos conhecidos de interesse bem como a minimização da necessidade de identificar segmentos potencialmente novos com o auxilio de operadores de estações de trabalho. De acordo com as concretizações apresentadas do invento estes métodos e aparelho melhorados são implementados nos sitios locais 16 do sistema 10.
Cada sitio local 16 está concebido para receber um sinal de difusão de RF a partir de, por exemplo, uma antena 18 ou de uma estação principal de televisão por cabo (não mostrado por motivo de simplicidade e clarificação) e pode reconhecer e identificar segmentos de difusão conhecidos por data, tempo, duração, canal e outra informação desejável. Os sitios locais 16 também podem reconhecer a ocorrência de segmentos desconhecidos, potencialmente novos e gerar assinaturas de chave temporárias respectivas de modo que possa ser mantido um registo destas ocorrências em função da identificação do segmento por um operador de estação de trabalho no sitio central. Apesar do sistema 10 ilustrar apenas três sitios locais 16, o sistema não está limitado por isso e qualquer número de sitios locais pode ser utilizado. De modo semelhante, o sistema 10 não está limitado a apenas duas estações de trabalho 14 como mostrado na Fig. 1. A Fig. 2 ilustra um dos sitios locais 16 na forma de blocos. Como mostrado aqui, cada sitio local 16 de um modo geral compreende uma porção de extremidade anterior 20 e uma porção de extremidade posterior 22. A porção de extremidade anterior 20 inclui um ou mais conversores de difusão de RF 24, um subsistema de reconhecimento de segmentos 26, um sensor 27 e um subsistema de captura de dados 28. A porção de extremidade posterior 22 inclui um computador de controlo 30 e, pelo menos, uma unidade de disco 32. 26
ΕΡ 1 261 155 /PT
Cada um dos conversores de difusão de RF 24 recebe sinais de difusão de televisão através de um canal respectivo e desmodula os sinais recebidos para proporcionar sinais áudio e vídeo de banda base. Os sinais áudio e vídeo são, de seguida, introduzidos no subsistema de reconhecimento de segmentos 26, em que assinaturas de quadro para cada um dos sinais áudio e vídeo são geradas as quais são, de seguida, comparadas com assinaturas de chave armazenadas para determinar se existe uma coincidência. Por motivos de clarificação, as assinaturas de vídeo e áudio são aqui designadas de forma separada por "sub-assinaturas". 0 subsistema de reconhecimento de segmentos também produz marcas de sinalização que representam ocorrências de sinal, tais como um desvanecimento de vídeo para preto ou um silenciamento de áudio. As marcas sinalização bem como a informação de coincidência são introduzidas no computador de controlo 30 para utilização na determinação se o sinal recebido representa um segmento novo ou uma mensagem comercial de interesse, na determinação de captura de informação áudio e vídeo para utilização no sítio central na identificação de um novo segmento de interesse, na averiguação da validade de coincidências questionáveis e para agrupar informação de coincidência para armazenamento numa base de dados. O sensor 27 está concebido para monitorizar a temperatura de funcionamento da extremidade anterior 20 e, no caso da temperatura de funcionamento exceder uma temperatura de funcionamento máxima, predeterminada, fornecer um sinal que o indica ao computador de controlo 30. De forma mais específica, o sensor 27 recebe informação de temperatura relativa aos subsistemas 26 e 28 proveniente de um ou mais termopares 29 e processa essa informação de temperatura recebida para a fornecer ao computador 30, de modo que se for determinada temperatura excessiva, os subsistemas 26 e 28 são desligados. O subsistema de captura de dados 28 recebe os sinais de difusão vídeo e áudio provenientes dos conversores 24 por meio do subsistema de reconhecimento de segmentos 26 e comprime e digitaliza os mesmos. Estes sinais digitalizados são armazenados numa memória temporária contida no subsistema 27
ΕΡ 1 261 155 /PT 28 durante um período de tempo predeterminado e a pedido os mesmos são fornecidos ao computador de controlo 30. O computador de controlo 30 está concebido para seleccionar assinaturas de chave, fornecer confirmação de coincidência, processar dados do novo segmento e comunicar com o sítio central 12. A unidade de disco 32 proporciona capacidade de armazenamento de dados em massa para informação de ocorrência de coincidência, nova informação de mensagens comerciais e dados áudio/vídeo para transmissão para o sítio central 12. A Fig. 3 ilustra o fluxo de dados para uma operação de coincidência típica. Como mostrado aqui, um dos conversores 24 recebe um canal desejado de sinais de difusão que são fornecidos como sinais áudio e vídeo de banda base ao subsistema de reconhecimento de segmentos 26. O subsistema 26 inclui uma pluralidade de cartas de canal 402, uma para cada canal monitorizado pelo sítio local 16, em que cada qual serve para gerar uma palavra máscara e uma sub-assinatura de quadro correspondente para cada quadro do sinal de vídeo de banda base. Além disso, cada placa de canal gera uma palavra máscara e uma sub-assinatura de quadro para cada intervalo do sinal áudio correspondente com um quadro do sinal de vídeo e com o mesmo formato das palavras máscara e sub-assinaturas de vídeo. É apreciado que a utilização de formatos de dados e intervalos correspondentes para as sub-assinaturas de vídeo e áudio facilitam, de forma vantajosa, o processamento dos mesmos. Também é apreciado que sub-assinaturas podem ser produzidas a partir de intervalos diferentes, tais como campos de vídeo ou combinações de campos ou de quadros ou de qualquer outra forma e que as sub-assinaturas de vídeo e áudio e as palavras máscara não necessitam de seguir o mesmo formato. As cartas de canal 402 também servem para detectar desvanecimento de sinais de vídeo para preto com base na recepção de, pelo menos, um campo, substancialmente, preto ou quadro do sinal de vídeo de banda base recebido, bem como em silenciamentos de áudio, numa redução do nível do sinal áudio de banda base que representa silêncio. As cartas de canal 402 também servem para detectar alterações na cena de vídeo indicadas por uma alteração rápida no sinal de vídeo. Estes eventos de sinalização, bem como as sub-assinaturas de vídeo 28
ΕΡ 1 261 155 /PT e áudio e as palavras máscara, produzidos pela carta de canal 402 são recebidos pelo controlador de reconhecimento de segmentos 404. Cada sítio local 16 está munido com, pelo menos, um conversor auxiliar 24 e uma carta de canal 402, de modo que se um dos conversores 24 e uma das cartas de canal 402 deixar de funcionar, o controlador de reconhecimento de segmentos 404 gera um comando para uma carta de canal e conversor auxiliares que então assumem as funções do equipamento inoperacional. O controlador de reconhecimento de segmentos 404 comunica com uma memória temporária em anel de assinaturas de segmento 406 para armazenar assinaturas de segmento recebidas recentemente, isto é, palavras máscara e assinaturas de quadro dispostas em sequência para cada canal, durante um intervalo de tempo predeterminado que precede o instante actual. O controlador de reconhecimento de segmentos também comunica com um dispositivo de correlação 420 para fornecer comandos de coincidência ao mesmo. O dispositivo de correlação 420 também é alimentado com as assinaturas de segmento adequadas a partir da memória temporária em anel de assinaturas de segmento 406 e com assinaturas de chave a partir de uma base de dados de assinaturas de chave 408. O dispositivo de correlação 420 realiza a operação de coincidência requerida e fornece os resultados da coincidência, em conjunto com a informação relevante (por exemplo, a correspondente contagem de erro), ao controlador de reconhecimento de segmentos 404. O controlador de reconhecimento de segmentos 404 fornece um relatório de coincidência para cada sub-assinatura de áudio e video e evento de sinalização a um módulo de sistema pericial 414 implementado pelo computador de controlo 30. O sistema pericial 414 avalia cada relatório de coincidência recebido para decidir se o mesmo é erróneo. Em certas situações, o sistema pericial 414 utiliza um processo de confirmação de coincidência na avaliação do relatório de coincidência. Naquele caso, o sistema pericial fornece um pedido de confirmação de coincidência a um módulo de confirmação de coincidência 422 também implementado pelo computador 30 o qual, em resposta ao mesmo, fornece um sinal ao controlador de reconhecimento de segmentos 404 a solicitar 29
ΕΡ 1 261 155 /PT a assinatura de segmento adequada. Em resposta a uma solicitação deste tipo, o controlador de reconhecimento de segmentos fornece a assinatura de segmento adequada ao módulo de confirmação de coincidência 422. Além disso, o módulo de confirmação de coincidência recebe a assinatura de chave adequada a partir de uma base de dados 412 mantida por um módulo de controlo da base de dados 416 do computador 30 sob o controlo do sistema pericial 414. Após a conclusão do processo de confirmação de coincidência, o módulo de confirmação de coincidência 422 fornece um sinal de confirmação de coincidência ao sistema pericial 414. Em resposta ao mesmo, o sistema pericial 414 fornece informação de coincidência, por exemplo, dados de ocorrência, através do módulo de controlo da base de dados 416 à base de dados 412.
Em certas situações, o sistema pericial 414 pode fornecer dados de ocorrência antes da recepção da resposta de confirmação de coincidência. Se, nestas situações, o módulo de confirmação de coincidência 422 determinar que não existe uma coincidência aceitável, o sistema pericial 414 fornece um sinal de anulação de coincidência através do controlo da base de dados 416 à base de dados 412 após o que a ocorrência fornecida anteriormente é anulada.
GERAÇÃO DE ASSINATURA DE VÍDEO
Cada uma das cartas de canal 402 produz assinaturas de quadro de vídeo ao produzir primeiro um vector diferença 150 na forma de uma sequência ordenada de elementos xi, x2, . .. Xi6 para cada quadro de vídeo de acordo com a técnica ilustrada na Fig. 4. Como mostrado na Fig. 4, um quadro 140 de um sinal de vídeo inclui uma região de patamar posterior 141, uma região de figura 142 e uma região de patamar anterior 143. A margem esquerda 146 da região de figura 142 está delimitada pela margem direita da região de patamar posterior 141, enquanto que a margem direita 147 da região de figura 142 está delimitada pela margem esquerda da região de patamar anterior 143.
Trinta e duas áreas de super pixel predeterminadas 144 estão definidas para cada quadro, das quais dezasseis áreas de super pixel exemplificativas estão ilustradas na Fig. 4. 30
ΕΡ 1 261 155 /PT
Cada área de super pixel 144 é rectangular e inclui, por exemplo, entre 18 e 21 pixéis em cada uma de 4 linhas horizontais verticalmente adjacentes da área de figura 142. Uma porção 144 é seleccionada, como descrito em maior detalhe de seguida, e um valor de luminância média da mesma é produzido. Cada área de super pixel 144 é emparelhada com uma outra área respectiva 144 como indicado pelas linhas a tracejado 148 na Fig. 4 para comparação com os respectivos valores médios de luminância da mesma. Cada um destes pares dos respectivos valores médios de luminância é utilizado para produzir o valor de um elemento xn correspondente do vector diferença 150. Por exemplo, o valor de luminância média da porção seleccionada de área de super pixel 144a é subtraido da área de super pixel emparelhada 144b para produzir o valor de um elemento xn correspondente do vector diferença 150.
De seguida, cada vector diferença 150 é sujeito a uma sequência de transformações vectoriais descritas abaixo que resultam num correspondente vector resultante ou transformado de dezasseis elementos. Então uma assinatura de quadro de dezasseis bits é produzida em que cada bit é activado ou desactivado em função do sinal de um elemento correspondente do vector resultante. Além disso, o valor de cada elemento do vector resultante é examinado para determinar se (1) o seu valor absoluto é inferior a um valor de banda de guarda, ou (2) o mesmo é susceptivel de instabilidade (como explicado abaixo). Se qualquer das condições (1) ou (2) for obtida, então o bit máscara correspondente de uma palavra máscara de 16 bits respectiva é activado.
Detecção de margem de vídeo
Referindo de novo a Fig. 4, será apreciado que as posições das áreas de super pixel 144 têm de ser determinadas de forma precisa em relação a uma margem da região da figura 142 de modo que pixéis de cada porção utilizados para produzir os respectivos valores médios de luminância correspondam de quadro para quadro. Os sinais de vídeo de mensagens comerciais televisivas são, muitas vezes, recebidos com um deslocamento horizontal em relação a uma posição padrão ou normal. O deslocamento horizontal mais frequentemente encontrado é um deslocamento para a direita 31
ΕΡ 1 261 155 /PT como determinado ao observar um receptor de televisão que resultasse num deslocamento para a direita da margem 146 da área de figura 142 na Fig. 4. Enquanto deslocamentos horizontais para a esquerda podem ocorrer, estes deslocamentos ocorrem significativamente menos vezes, do que deslocamentos para a direita. Apesar da maior parte dos deslocamentos horizontais ou afastamentos não serem tipicamente suficientemente grandes para poderem ser detectados por um espectador, estes deslocamentos podem afectar a geração de assinaturas de quadro por deslocação da margem de cada área de figura 142 do quadro de video deslocando, deste modo, as porções dos super pixéis utilizadas na geração da assinatura. Se não for compensado, este efeito irá degradar a capacidade do sistema 10 para produzir de forma fiável assinaturas de quadro e, deste modo, afectar de forma adversa a precisão global do sistema.
Um módulo de detecção de margem de video, implementado por cada uma das cartas de canal 402 da Fig. 3, é proporcionado para detecção de um deslocamento na margem da região de figura 142 de um sinal de video recebido. Uma vez que, como referido anteriormente, deslocamentos horizontais para a direita foram observados como ocorrendo com maior frequência, na descrição do módulo de detecção de margem de video, será assumido que ocorreu um deslocamento horizontal para a direita. No entanto, o presente invento não está limitado a este tipo de deslocamentos e pode ser utilizado para deslocamentos horizontais para a esquerda. A Fig. 5A ilustra um quadro de video com uma localização de margem normal ou padrão. Como mostrado aqui, o quadro de video inclui uma porção de patamar posterior, uma área de figura e uma porção de patamar anterior. A Fig. 5B ilustra um quadro de video com um deslocamento horizontal para a direita, em que um deslocamento deste tipo aumenta a dimensão da porção de patamar posterior e diminui a área de figura de uma quantidade correspondente. O módulo de detecção de margem de video coloca, pelo menos, um super pixel de detecção de margem 100, que é uma área de amostragem rectangular, através da fronteira entre a área de figura e a área de patamar posterior, como mostrado 32
ΕΡ 1 261 155 /PT nas Figs. 5A e 5B de modo que o super pixel 100 inclui a localização de margem normal bem como regiões de figura adjacentes para as quais a margem pode ser deslocada. Os dados de video dos super pixéis de detecção de margem 100 deste tipo são processados para determinar a posição da margem esquerda da área de figura. Cada super pixel de detecção de margem 100, com vantagem, possui a mesma área que a de cada área de super pixel 104, a qual, de preferência, possui uma dimensão de aproximadamente 18 a 21 pixéis de comprimento por 4 pixéis de altura. Como tal, cada super pixel de detecção de margem 100 contém porções de mais do que uma linha de video. Cada uma destas linhas de video no super pixel 100 proporciona dados sobre a posição de margem de figura esquerda. Numa concretização vantajosa, as posições de margem esquerda obtidas a partir de cada linha em todas as áreas de super pixel de detecção de margem 100 são combinadas para produzir uma localização estimada para a margem esquerda da área de figura. Assim ao combinar todos os dados de posição de margem esquerda, é obtida uma estimativa mais fiável da margem esquerda quando comparada com a derivada da utilização de apenas uma única linha de informação de posição de margem que pode ser influenciada de forma adversa por ruido no sinal de video.
Deste modo, a margem esquerda da figura é obtida ao combinar os valores de margem esquerda obtidos para cada uma das linhas de dados de video em todas as áreas de super pixel de detecção de margem 100. Assim a determinação da margem esquerda da figura, é preferível para descartar valores extremos obtidos das linhas de dados de video e da média dos valores restantes. Numa concretização preferida, os dois valores inferiores bem como o valor mais elevado para a margem esquerda da figura são considerados extremos e, como tal, são descartados. Uma vez que ruido de sinal está mais apto a resultar num valor baixo, são descartados mais valores baixos para a margem esquerda.
Como referido anteriormente, existem 32 áreas de super pixel 144 associadas com cada quadro do sinal de video. Em cada uma destas áreas de super pixel 144 está uma área de amostragem 102. Esta área de amostragem 102 é a área donde são extraídos os dados de vídeo para utilização na geração da 33
ΕΡ 1 261 155 /PT respectiva assinatura de quadro. Por exemplo, a Fig. 5A ilustra a localização da área de amostragem 102 na área de super pixel 144 para um quadro com uma condição de margem padrão. Quando as áreas de super pixel 144 medem entre 18 e 21 pixéis por quatro linhas, as áreas de amostragem são seleccionadas com vantagem para medir 4 pixéis por 4 linhas. Quando é detectado um deslocamento horizontal na margem esquerda da figura como explicado anteriormente, os efeitos de um deslocamento deste tipo sobre a área de amostragem 102 podem ser compensados pela alteração da área de amostragem 102 de acordo com o deslocamento horizontal detectado como mostrado na Fig. 5B. Isto é, se for determinado que a margem esquerda da figura se deslocou para a direita de N pixéis da posição normal, então a área de amostragem 102 também é deslocada para a direita de N pixéis.
Numa concretização preferida, o módulo de detecção de margem de video de preferência utiliza um número mínimo predeterminado de linhas de dados de vídeo (por exemplo, aproximadamente 6-8) a partir das áreas de super pixel de detecção de margem 100 para localizar a margem esquerda da área de figura. No entanto, quando a porção da área de figura adjacente ao patamar posterior é relativamente escura, pode ser difícil localizar de forma precisa a margem esquerda da área de figura a partir de qualquer das linhas de dados de vídeo contidas em todas as áreas de super pixel de detecção de margem 100. Nesta situação, um valor predeterminado por defeito é utilizado para a margem esquerda da área de figura.
Se o afastamento horizontal se estender para além das áreas de super pixel de detecção de margem 100 tal que a margem esquerda da figura fique fora das áreas 100, então o módulo de detecção de margem de vídeo considera que a margem esquerda não foi determinada. Nesta situação, é utilizado o valor por defeito predeterminado referido acima. Para além disso, em alguns casos, pode ser detectado um afastamento horizontal que é maior do que o que pode ser compensado, isto é, a área de amostragem 102 não pode ser deslocada de uma quantidade correspondente ao afastamento horizontal. Nesta situação, a área de amostragem 102 é deslocada da máxima quantidade possível. 34
ΕΡ 1 261 155 /PT
Para determinar a margem esquerda da área de figura para cada linha de vídeo, o módulo de detecção de margem de vídeo explora as amostras de pixel da esquerda para a direita à procura de um salto ou aumento no valor de luminância maior do que uma quantidade predeterminada entre um pixel respectivo e o pixel que está localizado dois pixéis para a direita do pixel respectivo. Se um salto deste tipo for detectado, a diferença nos valores de luminância entre o pixel que estiver a ser testado no momento e o pixel três pixéis para a direita é então determinada para garantir que o aumento no valor de luminância é novamente igual ao valor predeterminado para filtrar picos de ruído. Além disso, ao examinar pixéis que estão localizados dois pixéis para a direita do pixel que estiver a ser testado, em vez de testar pixéis adjacentes, pode ser detectada uma margem que no caso contrário não seria detectável quando pixéis adjacentes fossem testados. Isto é, em cenas de vídeo relativamente escuras, o declive (diferença) dos valores de figura de margem é menor do que em cenas relativamente brilhantes. 0 módulo de detecção de margem de vídeo pode colocar a margem esquerda da figura um ou dois pixéis antes da margem ocorrer na realidade. Isto não apresenta um problema na medida em que o módulo de detecção de margem de vídeo corrige diferenças entre posições da margem esquerda para diferentes emissões e não necessita de detectar uma posição de margem absoluta.
Deste modo, o módulo de detecção de margem de vídeo melhora a precisão do sistema ao permitir que assinaturas fiáveis de quadro de vídeo sejam obtidas a partir do sinal de vídeo recebido. Além disso, o módulo de detecção de margem de vídeo compensa os afastamentos horizontais sem necessitar de qualquer suporte físico adicional no sítio local 16.
Pré-processamento de vídeo
Foi observado que certos valores de assinaturas de quadro de vídeo ocorrem com maior frequência, do que outros valores de assinaturas de quadro de vídeo de modo que as assinaturas de quadro de vídeo tendem a ficar concentradas junto de certos valores (algumas vezes referidos aqui como 35
ΕΡ 1 261 155 /PT "agrupamento"). Este agrupamento de assinaturas de quadro de vídeo pode apresentar vários problemas. Primeiro, uma assinatura de quadro de vídeo que ocorra com frequência, designada como uma "assinatura de grupo", é provável que seja seleccionada como uma palavra-chave. Em consequência, esta palavra-chave ou assinatura de grupo pode possuir um grande número de assinaturas de chave associadas com a mesma. Uma vez que o dispositivo de correlação 420 do sistema de reconhecimento de segmentos 26 pesquisa todas as assinaturas de chave correspondentes a uma palavra-chave respectiva, o agrupamento de assinaturas pode aumentar de forma acentuada o tempo de processamento do dispositivo de correlação. Em consequência, isto pode limitar a quantidade de dados que podem ser armazenados na base de dados do sítio local 16 e/ou o número de canais de emissão que podem ser processados. Em segundo lugar, o agrupamento pode provocar um aumento de falsa coincidência. Isto é, à medida que o número de assinaturas que estão associadas com uma palavra-chave de assinatura de grupo aumenta, mais próximos uns dos outros podem ficar os padrões de bit destas assinaturas. Em consequência, se uma ligeira alteração numa assinatura de segmento ocorrer, por exemplo, devido a ruído ou instabilidade de sinal, o dispositivo de correlação 420 pode reportar de forma não precisa uma coincidência. O agrupamento pode ser considerado para provocar uma redução na quantidade real de informação numa assinatura. Por exemplo, na situação em que todas as assinaturas de quadro de vídeo são as mesmas, o valor de cada assinatura é conhecido à priori. Por conseguinte, nesta situação, o valor da assinatura de quadro de vídeo seguinte pode ser descrito por zero bits. No outro extremo, isto é, quando as assinaturas de quadro de vídeo são completamente aleatórias de modo a possuírem uma distribuição uniforme de valores, todos os bits na assinatura são necessários para identificar a respectiva assinatura.
Este agrupamento pode ser reduzido ou minimizado através do aumento da uniformidade da distribuição da assinatura de quadro de vídeo. Por exemplo, se as assinaturas de quadro de vídeo forem uniformemente distribuídas, cada assinatura ocorreria com igual frequência. Cada uma das cartas de canal 36
ΕΡ 1 261 155 /PT 402 do subsistema de reconhecimento de segmentos 26 (Fig. 15) pré-processa o sinal de video de entrada para produzir assinaturas de quadro de video que são distribuídas de forma mais uniforme. Isto é, a placa de canal 402 transforma o sinal de video de entrada através da utilização de uma transformação vectorial que, por sua vez, utiliza dados estatísticos que pertencem a informação de agrupamento relevante para reduzir ou minimizar o agrupamento de assinaturas de quadro de video através da redução da correlação entre os bits de cada quadro, o que origina uma distribuição mais uniforme de assinaturas. O processamento de transformação vectorial realizado pelas cartas de canal 402 será agora descrito em maior detalhe.
Numa concretização vantajosa do invento, uma transformada de Hotelling é utilizada para concretizar uma transformação vectorial do vector diferença 150 Fig. 4 que é designado por x abaixo e inclui dezasseis elementos ordenados (xi, X2 ... χιδ), o que resulta numa redução da covariância entre os elementos xi, x2 ... Xi6 de x. A transformada de Hotelling pode ser expressa como se segue: 7 = A(x-n) em que x representa o vector diferença 150, m é um vector que representa os valores médios dos elementos de x, A representa uma transformação matricial e y é um vector que representa o vector transformado x. Logo que o vector transformado y tenha sido produzido, uma assinatura de quadro é obtida a partir do mesmo por conversão do sinal de cada elemento do vector y num valor de bit respectivo da assinatura de quadro. Isto é, é atribuído um valor binário aos elementos positivos do vector y, enquanto é atribuído o outro valor binário aos elementos negativos do mesmo.
Cada elemento no vector transformado y pode ser expresso como se segue: y(i) « 2[A(i,j)*(x(j) - m(j))], j - 0 to 15 A covariância de y pode ser expressa como se segue: [Cy3 = 77' - tA(z-B)] [A(x-a)]' = A(x-m) (x-m) V = A(C*) A' 37
ΕΡ 1 261 155 /PT em que (') representa a transposta do vector respectivo. Se as linhas na matriz A forem seleccionadas como os valores próprios normalizados da matriz Cx (a covariância de x), a matriz Cy é diagonal. Em consequência de uma selecção deste tipo, os bits da assinatura de quadro recentemente formada (Fig. 10), que são derivados de y, são incorrelacionados. No entanto, apesar dos bits contidos na assinatura de quadro serem incorrelacionados, os mesmos podem não ser estatisticamente independentes. Apesar disso, a interdependência entre os mesmos é reduzida.
Numa concretização preferida do presente invento, assume-se que a transformação matricial A é constante. Esta assunção implica que o sinal de video que chega é um processo estacionário lato senso de modo que os valores para Cx e m são constantes.
Para determinar o valor da transformação matricial A, os valores para os vectores m e [Cx] são utilizados. Estes valores podem ser obtidos como se segue: a = (l/N) Σ(Χ), j = 1 to » (4) e
j = N
[Cx] = [(1/Ν)Σ(χχ)] -aua' (5) j = 1 em que N representa o número de amostras de x que são utilizadas para determinar os valores de m e [Cx] . Após a determinação do valor de [Cx], a transformação matricial A pode ser obtida através da determinação dos vectores próprios de [Cx] .
Para minimizar a susceptibilidade à instabilidade de quadro, a assinatura de quadro é calculada para um número predeterminado de vezes e as assinaturas obtidas comparadas para diferenças entre as mesmas. Isto é, numa concretização preferida, a assinatura de quadro é determinada como se deslocamentos horizontais no quadro de video associado de -1, 0 e +1 pixéis tivessem ocorrido. Se um bit ou bits nestas três palavras de assinatura variarem entre si, então o bit ou bits máscara correspondentes são activados. Além disso, se um 38
ΕΡ 1 261 155 /PT valor de diferença transformado for relativamente próximo de zero, o bit máscara correspondente ao mesmo é activado.
Se o processo de transformação de Hotelling for aplicado a um sinal de video como descrito acima, grupos de assinaturas relativamente grandes podem não ser divididos de forma tão fina como desejado. Isto é, uma vez que a covariância utilizada neste processo se baseia em dados video de todos os quadros de video de entrada, enquanto que os quadros com assinaturas agrupadas são quantificados apenas para uma percentagem relativamente pequena de todos os quadros, a contribuição efectiva dos quadros com assinaturas agrupadas para a covariância pode ser pequena. Uma abordagem para dividir de forma mais eficaz estas concentrações relativamente grandes de assinaturas de quadro é utilizar transformações separadas para grupos de quadros com valores de assinatura semelhantes e que ocorrem com maior frequência média, os quais são referidos daqui em diante como "agrupamentos". Uma transformação deste tipo também divide de forma eficaz agrupamentos associados a assinaturas com valores que possuem os bits opostos aos associados com o agrupamento original. A utilização de um único processo de transformação aumenta a uniformidade da distribuição da assinatura de quadro e, em consequência, o número de quadros de vídeo associados aos respectivos valores de assinatura de quadro fica mais próximo do número médio de assinaturas de quadro obtido através da utilização do processo de transformação e possui uma relação de coincidência aceitável maior associada às mesmas quando comparada com as assinaturas obtidas sem transformação.
Por outro lado, a utilização de transformações diferentes para valores de assinatura ou intervalos de valores de assinatura diferentes pode aumentar a uniformidade da distribuição de assinatura de quadro mesmo sobre as obtidas através da utilização de uma única transformação. De forma mais específica, quando se utiliza transformações múltiplas deste tipo, as palavras de assinatura que chegam são classificadas quer como pertencendo a um agrupamento quer não pertencendo a um agrupamento, isto é, uma concentração de 39
ΕΡ 1 261 155 /PT ocorrências de assinatura de quadro (ou maior frequência de ocorrências) num certo valor ou intervalo de valores de assinatura. Esta classificação é realizada através da determinação da distância, por exemplo, a distância de Hamming, de uma assinatura de quadro proveniente de uma matriz modelo. A distância de Hamming refere-se ao número de bits que são diferentes entre duas palavras binárias e a matriz modelo contém a assinatura ou assinaturas de quadro que representam o centro de um agrupamento. Se a assinatura de quadro que chega ficar dentro de uma distância de Hamming ou número de bits predeterminados das assinaturas de quadro da matriz modelo, a respectiva assinatura é transformada através da utilização de uma transformação adequada da pluralidade das transformações. Uma distância de Hamming de um ou dois bits da matriz modelo proporciona uma distribuição de assinatura melhorada, sendo preferida uma distância de dois bits.
Quando um quadro recebido produzir uma assinatura que possui um valor que fica sobre a fronteira de valores produzidos por transformações diferentes, é importante que a transformação empregue dê origem a uma assinatura que corresponda à do mesmo quadro se recebida de seguida. Para evitar sensibilidades à influência de ruido que pode resultar na produção de assinaturas diferentes para o mesmo quadro recebido em instantes diferentes, nestes casos de fronteira são produzidas assinaturas de quadro através da utilização de ambas as transformações onde após as quais bits máscara são activados em cada correspondente palavra máscara para quaisquer bits correspondentes nas assinaturas produzidas pelas diferentes transformações que diferem entre si.
Consequentemente, através da concretização de uma transformação vectorial de um vector diferença que representa o conteúdo de informação de um quadro, é possível reduzir a correlação entre os elementos do mesmo aumentando, deste modo, a uniformidade da distribuição de assinaturas de quadro que, no caso contrário ficariam concentradas à volta de certos valores. Uma técnica particularmente vantajosa emprega uma transformada de Hotelling para reduzir a covariância entre os elementos vectoriais, de modo que a sua correlação é, deste modo, reduzida. 40
ΕΡ 1 261 155 /PT Máscara anti-instabilidade
Um módulo de máscara anti-instabilidade é implementado por cada uma das cartas de canal 402 e é concebido para tornar as assinaturas de quadro de vídeo menos sensíveis a deslocamentos verticais e horizontais na figura de vídeo que podem variar de emissão para emissão. Estes deslocamentos verticais e horizontais podem ser devidos a instabilidades de temporização de suporte físico ou a instabilidade no sinal de vídeo transmitido.
De forma mais específica, o módulo de máscara anti-instabilidade compensa deslocamentos de curta duração tanto verticais como horizontais conhecidos como instabilidade e/ou afastamentos sistemáticos que podem ser originados pelo suporte fisico de transmissão ou pelo suporte físico de recepção. Como é apreciado, os afastamentos sistemáticos também podem ser compensados pelo módulo de detecção de margem, como descrito anteriormente.
Como descrito acima, tanto uma palavra de assinatura de 16 bits como a palavra máscara de 16 bits correspondente são geradas para cada quadro de video. Cada bit na palavra máscara corresponde a um bit na palavra de assinatura. Ao activar um bit na palavra máscara, porções de sistema 10 (Fig. 1) que utilizam a assinatura de quadro de video são efectivamente avisadas que o bit correspondente na assinatura de quadro de vídeo não deverá ser considerado fiável. Por exemplo, este aviso é utilizado na selecção da palavra-chave e de palavras de coincidência para uma assinatura de chave e na activação do limiar de erro para determinar uma coincidência através da utilização de uma dada assinatura de chave. Além disso, uma vez que são espectáveis erros que ocorrem nos bits de uma palavra de assinatura de quadro que correspondem a bits activos na palavra máscara, este aviso também é utilizado no dispositivo de correlação 420 do subsistema de reconhecimento de segmentos 26 para determinar contagens de erros no processo de coincidência. O módulo de máscara anti-instabilidade produz somas respectivas de valores de luminância de pixel para cada área de super pixel e um número predeterminado (por exemplo, 41
ΕΡ 1 261 155 /PT quatro) de áreas de super pixel adjacentes. Numa concretização vantajosa, as áreas de super pixel adjacentes incluem uma área que está deslocada para cima e para a esquerda da respectiva área de super pixel, uma área que está deslocada para cima e para a direita da respectiva área de super pixel, uma área que está deslocada para baixo e para a esquerda da respectiva área de super pixel e uma área que está deslocada para baixo e para a direita da respectiva área de super pixel. A partir de cada uma destas cinco áreas de super pixel, isto é, da respectiva área de super pixel e das quatro áreas de super pixel deslocadas, são produzidas somas respectivas dos valores de luminância dos pixéis contidos nas áreas. Valores semelhantes são obtidos para as outras 31 áreas de super pixel contidas em cada quadro de video para produzir quatro conjuntos de trinta e dois valores cada um para um correspondente grupo deslocado de áreas de super pixel. Depois, cinco assinaturas de quadro de video são geradas, isto é, uma pela utilização dos 32 super pixéis não deslocados e quatro pela utilização de cada um dos quatro conjuntos de 32 super pixéis deslocados. A Fig. 6 ilustra este processo exemplificativo concretizado para um super pixel. Na Fig. 6, um super pixel principal 120, que possui uma dimensão de quatro pixéis de largura por quatro pixéis de altura, é deslocado na forma descrita acima por dois pixéis na direcção vertical e dois pixéis na horizontal. Isto é, uma área de super pixel 122 é localizada ao deslocar uma área de amostragem dois pixéis para cima e dois pixéis para a esquerda do super pixel principal 120. De modo semelhante, áreas de super pixel 124, 126 e 128 também são obtidas pela deslocação de uma área de amostragem dois pixéis para baixo e para a esquerda, dois pixéis para baixo e para a direita e dois pixéis para cima e para a direita.
Se qualquer bit nas assinaturas de quadro de video correspondente às quatro áreas de super pixel deslocadas diferir da mesma na assinatura de quadro de video obtida da área de super pixel (principal) não deslocada, então o mesmo bit é considerado como sendo sensível a instabilidade após o que o bit máscara que corresponde a este bit é activado. É apreciado que, examinando deste modo cada uma destas áreas respectivas de super pixel, o módulo de máscara anti-instabilidade determina se o valor de um bit particular 42
ΕΡ 1 261 155 /PT contido na palavra de assinatura de quadro de video varia se tiver existido um deslocamento na figura de video que corresponda ao deslocamento utilizado para obter o super pixel deslocado. A quantidade pela qual o super pixel 120 da Fig. 6 é deslocado nas direcções vertical e horizontal pode ser variada. Para um comprimento, quanto maior o deslocamento nas direcções vertical e horizontal do super pixel 120, maior o deslocamento na direcção vertical e horizontal do sinal de video que pode ser compensado pelo módulo anti-instabilidade. No entanto, um deslocamento relativamente grande da área de super pixel principal 120 nas direcções vertical e/ou horizontal pode resultar num número relativamente grande de bits que são activados na palavra de bits máscara. É apreciado que, se um número demasiado grande de bits for activado numa palavra máscara, a correspondente palavra de assinatura de quadro quase não contém informação significativa. Por exemplo, se o super pixel principal 120 for deslocado de uma quantidade relativamente grande nas direcções horizontal e/ou vertical, os resultados obtidos a partir dai indicariam que a maior parte se não a totalidade dos bits era sensível a instabilidade. Como descrito anteriormente, numa concretização do presente invento, cada super pixel principal 120 é deslocado dois pixéis na direcção horizontal e dois pixéis na direcção vertical. Noutra concretização vantajosa do presente invento, cada super pixel 120 é deslocado de um pixel para a direita e para a esquerda na direcção horizontal mas sem um deslocamento vertical.
Deste modo, o módulo de máscara anti-instabilidade activa os bits na palavra de bits máscara para os bits correspondentes contidos em cada assinatura de quadro de vídeo que podem ser sensíveis a instabilidade ou afastamentos. Além disso, o módulo de máscara anti-instabilidade, como o módulo de detecção de margem, está principalmente incluído num programa de suporte lógico do sub-sistema de reconhecimento de segmentos 26 e, como tal, requer um custo mínimo para implementação em cada um dos sítios locais 16. 43
ΕΡ 1 261 155 /PT A técnica de máscara anti-instabilidade é de preferência concretizada em combinação com uma técnica de máscara de banda de guarda em que o bit máscara para um dado bit de assinatura de quadro é dissimulado se o valor absoluto da diferença entre os valores médios de luminância das duas áreas de super pixel correspondentes for inferior a um valor de banda de guarda predeterminado. Por exemplo, se valores de luminância para um dado sinal de video forem digitalizados numa escala de zero a 256, um valor exemplificativo de banda de guarda de 64 pode ser seleccionado. Se o bit máscara de um elemento de vector correspondente for activado, o bit máscara do bit de assinatura respectivo é activado. Isto é, o bit máscara de qualquer dado bit de assinatura é activado se a máscara de banda de guarda ou a máscara anti-instabilidade activarem este bit máscara.
GERAÇÃO DE ASSINATURA DE ÁUDIO
Com referência à Fig. 7A são geradas assinaturas de áudio por uma montagem de geração de assinaturas de áudio 250 ilustrada aqui incorporada em cada uma das cartas de canal 402 (Fig. 3) para cada canal de emissão de dados áudio que se destinar a ser monitorizado. A montagem de geração de assinaturas de áudio 250 de um modo geral compreende um circuito de amostragem e condicionamento de sinais áudio 202, um circuito de memória temporária de entrada e conversão A/D 204, um módulo de transformação e extracção de assinatura 206 e um circuito de saída 208. De forma mais específica, um sinal áudio de banda base proveniente de um canal de emissão é introduzido no circuito 202. Numa concretização preferida, o sinal áudio banda base é sujeito a um filtro passa baixo pelo circuito 202 para satisfazer o critério de Nyquist e para enfatizar o conteúdo de sinal de voz sobre música e outros sons, o que simplifica os requisitos de processamento e memória sem sacrificar o conteúdo de informação necessário, uma vez que a maioria da submersão de sinais áudio de televisão contém voz humana. O sinal de banda limitada do circuito 202 é introduzido no circuito 204 para conversão na forma digital. O áudio digitalizado do circuito 204 é introduzido no módulo de transformação e extracção de assinatura 206 que utiliza um processo de transformada rápida de Fourier (FFT) para geração de assinaturas de quadro de 44
ΕΡ 1 261 155 /PT áudio e correspondentes palavras máscara. As assinaturas de áudio e as palavras máscara são introduzidas no circuito de saida 208 para conversão para uma forma adequada para saida do subsistema de reconhecimento de segmentos 26. A montagem de geração de assinaturas de áudio 250 é mostrada em maior detalhe na Fig. 7B, a qual será agora descrita.
Como mostrado na Fig. 7B, a montagem de geração de assinaturas de áudio 250 inclui uma porção analógica (que contém o circuito de amostragem e condicionamento de sinais áudio 202) e uma digital porção (que contém os circuitos 204 e 208 e o módulo 206). O circuito 202 compreende um circuito de controlo automático de ganho (AGC) 254, um filtro capacitivo comutado 256 e um circuito de amostragem e retenção 258. De forma mais específica, um sinal áudio de banda base proveniente de um canal de emissão é introduzido no circuito de controlo automático de ganho (AGC) 254 para manter um nível de energia áudio relativamente uniforme. Isto é, uma vez que o processamento de transformada rápida de Fourier (FFT) acumula potência áudio durante o processamento normal, é desejável evitar que a energia de áudio de entrada se torne relativamente grande para evitar recorte do sinal processado FFT de saida. Um sinal de saida do circuito AGC 254 é introduzido no filtro capacitivo comutado 256 o qual, numa concretização preferida, é um filtro passa baixo com uma redução de 3 dB numa frequência de aproximadamente 3200 Hz, uma vez que o espectro de densidade de potência para voz cai rapidamente em frequências acima de 3kHz. O sinal de saída do filtro capacitivo comutado 256 é proporcionado para captura do sinal áudio (descrito abaixo) e também é introduzido através do circuito de amostragem e retenção 258 no circuito de memória temporária de entrada e conversão A/D 204. É apreciado que em alternativa, podem ser proporcionados sinais de áudio não filtrados para captura do sinal áudio. O circuito 204 compreende um conversor de analógico para digital 260 e uma memória temporária primeiro a entrar primeiro a sair (FIFO) 262. O sinal de saida do circuito de amostragem e retenção 258 é introduzido no conversor analógico digital 260 que recebe um sinal de amostragem ou temporização, que é derivado de um sinal de impulso de sincronização horizontal de vídeo, proveniente de um circuito 45
ΕΡ 1 261 155 /PT de temporização 266. Numa concretização preferida, o sinal de amostragem possui uma frequência de aproximadamente 15.260 Hz. Em consequência, o conversor 260 amostra os dados áudio recebidos com uma taxa de amostragem de aproximadamente 15.260 Hz. A saída do conversor 260 é introduzida no circuito de memória temporária FIFO 262. A saída do circuito FIFO 262 é introduzida num processador de sinal digital áudio 264 incluído no módulo de transformação e extracção de assinatura 206. O processador de sinal digital 264 serve para processar os dados áudio recebidos para criar assinaturas de áudio e assinaturas de máscara correspondentes cujo formato e temporização dos dados corresponde às assinaturas de quadro de vídeo e palavras máscara para simplificação de processamento adicional. São proporcionados sinais de temporização para o processador de sinal digital 264 a partir do circuito de temporização 266. O sinal de saída do processador de sinal digital 264, que inclui as assinaturas de áudio e as correspondentes palavras máscara, é introduzido no circuito de saída 208. O circuito de saída 208 compreende um circuito de memória temporária primeiro a entrar primeiro a sair (FIFO) 268, um microprocessador 270, uma RAM de porta dupla 272 e um circuito de interface 274. O sinal de saída do processador de sinal digital 264 é introduzido através da memória temporária primeiro a entrar - primeiro a sair (FIFO) 268 no microprocessador 270. Uma vez que as taxas de processamento associadas com o processador de sinal digital 264 e com o microprocessador 270 podem diferir, o circuito FIFO 268 armazena temporariamente os dados do processador de sinal digital para alimentar o microprocessor. O microprocessador 270, que pode ser um Intel 80188, serve para extrair os dados de assinatura de áudio e de palavra máscara recebidos do circuito FIFO 268 em intervalos predeterminados. Estes dados extraídos são de seguida introduzidos através do circuito RAM de porta dupla 272 no circuito de interface 274. Uma vez que o sinal de dados de saída do microprocessador Intel 80188 270 possui um formato de 8 bits enquanto o circuito de interface 274 está concebido para transferir sinais de dados com um formato de 16 bits, o circuito RAM de porta dupla 272 armazena temporariamente os dados de 8 bits recebidos para proporcionar dados de 16 bits a partir do mesmo. 46
ΕΡ 1 261 155 /PT Ο processamento realizado pelo processador de sinal digital 264 na criação de assinaturas de áudio e as assinaturas de máscara correspondentes serão agora descritos de forma mais completa. 0 processamento realizado pelo processador de sinal digital 264 é sincronizado para os campos de video correspondentes de modo que uma sequência de processamento completa seja repetida em todos os quadros de video. De forma mais especifica, o processador de sinal digital 264 transforma as 256 palavras de dados áudio recebidas do circuito FIFO 262 em 128 pontos de dados complexos ao determinar a média das palavras adjacentes das 256 palavras e ao colocar as palavras imaginárias a zero. isto reduz a taxa de dados para aproximadamente 7,6K amostras digitais/segundo. Será apreciado que a taxa de entrada de dados para processamento FFT satisfaz a frequência de amostragem mínima necessária para que seja evitado efeito de escada. Uma sobreposição de 50% na transformada rápida de Fourier é obtida através da utilização dos 128 pontos de dados complexos que foram gerados para o campo anterior em conjunto com os novos 128 pontos de dados complexos para o campo actual. Esta sobreposição de dados possui o efeito de permitir a contribuição razoável de todos os pontos de dados na janela que inclui os pontos fronteira.
Com referência à Fig. 8, que de um modo geral ilustra a sequência de passos de processamento concretizados pelo processador 264 os pontos de dados complexos acima foram gerados por um módulo de entrada 300 e de seguida um módulo de janela 302 multiplica os pontos de dados complexos pelos coeficientes de janela, que numa concretização preferida efectua um processo de co-seno quadrado ou de Hanning em janelas num processo de co-seno quadrado por janelas, a amplitude de uma amostra de sinal áudio é multiplicada por um factor que é proporcional ao quadrado do co-seno de um ângulo que corresponde a uma localização no tempo da amostra respectiva no intervalo de quadro correspondente. Esta multiplicação reduz a presença de picos de sinal em qualquer extremidade do intervalo de quadro e injecta um grau de periodicidade no sinal de dados áudio para melhorar os resultados do processamento FFT. De forma mais específica, 47
ΕΡ 1 261 155 /PT uma vez que o processamento de transformada rápida de Fourier é, em primeiro lugar, concebido para utilização em sinais periódicos, se o sinal a transformar não for, de forma substancial, periódico, o sinal transformado pode ser de forma incorrecta disperso através de várias bandas de frequência. 0 processamento de pontos de dados complexos com coeficientes de janela, tais como os associados com uma janela de co-seno quadrado, minimiza a tendência para esta dispersão de sinal. 0 processo de determinar a média de dados descrito anteriormente e o processo de sobreposição, em conjunto com o processo de utilização de janelas de co-seno quadrado, proporciona uma base de processamento que minimiza diferenças de temporização quadro a quadro no sinal áudio recebido e permite contribuições iguais de frequência a cada porção do espectro áudio de interesse.
Os dados multiplicados produzidos pelo módulo de janela 302 são processados por um módulo FFT 304 que realiza uma transformação de 256 pontos complexos raiz-2 DIP (limitação em frequência) através da utilização de factores de ponderação ou de coeficientes de multiplicação adequados, que podem ser armazenados numa tabela de pesquisa que é descarregada para o processador de sinal digital 264 do computador de controlo 30 (Fig. 2) durante um protocolo de arranque. O módulo FFT 304 implementa efectivamente 256 filtros passa banda diferentes. A saída produzida pelo módulo FFT 304, que representa informação tanto de amplitude como de fase do sinal áudio em cada banda, é introduzida num módulo de amplitude quadrática 306 para obter um valor de amplitude quadrada ou potência para cada uma das bandas no espectro de frequência. Em consequência, a informação de fase do módulo FFT 304, que não é necessária no processamento subsequente, é efectivamente descartada pelo módulo 306 e não é proporcionada a partir do mesmo. O módulo de amplitude quadrática 306 produz valores de amplitude elevados ao quadrado que representam a potência dos pontos espectrais complexos produzidos pelo módulo FFT 304. Devido a simetria, apenas a primeira metade do espectro de potência é calculada. O resultado da operação quadrática é um número de 30 bits com 2 bits de sinal, dos quais apenas 16 bits são gravados. De um modo geral, os valores são pequenos, 48
ΕΡ 1 261 155 /PT de modo que um processo de escalar saturação é utilizado através do qual os 16 bits superiores são gravados depois da deslocação para a esquerda de cada palavra de dados de um número predeterminado de posições de bit (por exemplo, 6 posições de bit). Se o deslocamento provocar um excesso de capacidade de processamento, a palavra resultante é colocada num valor de saturação de FFFF (Hex).
Os valores produzidos pelo módulo de amplitude quadrada 306 são processados por um módulo de selecção de banda 308 para seleccionar valores de banda de frequências para um número predeterminado de bandas. A selecção de banda é realizada de acordo com instruções predeterminadas armazenadas numa tabela de pesquisa que é descarregada para o processador de sinal digital 264 durante o protocolo de arranque. Numa concretização preferida, os valores de banda de frequências de 16 bandas são seleccionados e processados por um módulo de filtragem de resposta impulsiva finita (FIR) 310. O filtro FIR 310 realiza uma operação de filtragem de resposta impulsiva finita de 15 estágios em cada um dos 16 valores de banda de frequências recebidos. Coeficientes para o filtro FIR 310, os quais numa concretização preferida são coeficientes de janela Hamming seleccionados para concretizar uma operação de filtragem passa baixo, são proporcionados a partir de uma tabela de pesquisa que é descarregada para o processador de sinal digital 264 durante o protocolo de arranque.
Os deslocamentos de temporização de sinais áudio em relação ao video difundido em simultâneo são frequentemente encontrados em emissões de televisão e, se ignorados no processo de geração de assinaturas de áudio, podem dar origem a assinaturas de áudio que estão desfasadas das assinaturas de video correspondentes. Isto provavelmente degrada a capacidade do sistema 10 para fazer corresponder de forma precisa os segmentos que chegam. O módulo FIR 310 serve para melhorar a estabilidade de assinatura ao determinar a média dos dados de espectro áudio sobre um número de quadros de televisão, para deste modo melhorar a probabilidade de obtenção de coincidências de assinatura correctas. 49
ΕΡ 1 261 155 /PT
Ao determinar a média dos valores de banda de frequências sobre um número de quadros, o processamento concretizado pelo módulo 310 também serve para maximizar a correlação quadro a quadro. Isto tende a criar grupos de assinaturas semelhantes com uma duração de vários quadros e referidos como passagens. A presença de comprimentos de passagem permite a geração de assinaturas de chaves de áudio que são mais prováveis de coincidência quando o mesmo segmento de áudio é novamente recebido pelo sistema 10, promovendo deste modo a precisão e a eficiência do sistema. Outra vantagem é que erros que resultem de ruído, quantificação e arredondamento são menos críticos uma vez que os mesmos tendem a ter a média extraida.
Os sinais de saida filtrados pelo filtro FIR 310 são então processados por um módulo de fixação 311 que está concebido para fixar os sinais de saída filtrados entre valores altos e baixos predeterminados. A fixação dos sinais filtrados para um valor alto predeterminado evita exceder capacidade de processamento que poderia caso contrário ocorrer durante o processamento subsequente, enquanto que a fixação dos sinais filtrados para um valor baixo predeterminado evita possiveis divisões por zero e os valores de fixação predeterminados são seleccionados em conformidade. Por exemplo, quando os valores de banda de frequências de média extraida para fixação são proporcionados como palavras de 16 bits que se situam num intervalo de valores de O-FFFF (Hex), um valor de fixação inferior a F(Hex) pode ser empregue, enquanto um valor de fixação superior a 3FFF (Hex) pode ser empregue. A saída produzida pelo módulo de fixação 311 é então processada por um módulo de normalização 313, após o que cada um dos valores obtidos pelo módulo de fixação é normalizado de uma forma predeterminada. Esta normalização pode ser realizada para vários dos 16 valores de banda fixados pela divisão do respectivo valor de cada banda pela soma dos valores nas bandas tanto acima como abaixo da respectiva banda de frequência. Numa margem do espectro de frequência, no entanto, valores das bandas acima ou abaixo da banda de margem são utilizados (ou pelo contrário apenas um único valor de banda adjacente é empregue). Noutras situações, no 50 ΕΡ 1 261 155 /PT entanto, valores de três bandas podem ser utilizados na determinação do valor normalizado para uma respectiva banda. Este processo de normalização pode ser representado como se segue:
Bn normal = Bn
Badj (6) em que, Bn representa o valor fixado para uma respectiva banda n, Badj representa o valor (es) fixado para a banda (s) adjacente. A Tabela I abaixo ilustra a banda(s) adjacente utilizada na determinação do valor normalizado de acordo com uma concretização preferida. Pela utilização de números de bandas que variam para produzir Badj para diferentes bandas de frequência no processo de normalização, a distribuição estatística de assinaturas de áudio de entre as palavras-chave pode-se tornar mais regular. Em consequência, o agrupamento de assinaturas de áudio à volta de certas palavras-chave é reduzido.
TABELA I
Banda Freq. central
Bandal 120Hz Banda2 150 Banda3 180 Banda4 210 Bandaõ 240 Banda6 300 Banda7 360 Banda8 420 Banda9 480 BandalO 600 Bandall 720 Bandal2 840 Bandal3 960 Bandal4 1440 Bandalõ 1920 Bandalô 2400
Badj BANDA2 +BANDA3 BANDAl+BANDA3+BANDA4 BANDA2 +BANDA4 BANDA3+BANDA5+BANDA6 BANDA4+BANDA6 BANDA5 +BANDA7+BANDA8 BANDA6 +BANDA8 BANDA7+BANDA9+BANDA10 BANDA7+BANDA8+BANDA10 BANDA9 +BANDA11 BANDA9 +BANDA10 + BANDA12 BANDAl1+BANDA13 BANDAl1+BANDA12 +BANDAl4 BANDAl3+BANDA15 BANDAl3 +BANDA14 +BANDAl6 BANDAl4 +BANDA15 A Tabela I resume também uma selecção vantajosa de bandas de frequência para uma técnica de geração de assinaturas baseada principalmente no conteúdo de voz de um sinal áudio de televisão. Cada uma das bandas de 1 até 16 51
ΕΡ 1 261 155 /PT possui uma largura de banda de 30 Hz. É apreciado, no entanto, que uma selecção diferente de bandas e/ou de larguras de banda pode ser adoptada. Na produção de Badj para cada banda Bn, é preferível empregar valores de bandas próximas uma vez que isso minimiza quaisquer distorções devidas a diferenças de atrasos de tempo em frequências diferentes. Isto é, sinais de frequências relativamente próximas tipicamente são atrasados para um grau semelhante, apesar de sinais de frequências substancialmente diferente poderem estar sujeitos a atrasos de frequência substancialmente diferentes.
Os valores de banda normalizados produzidos pelo módulo de normalização 313 são então processados por um módulo de geração de assinaturas 312. De modo especifico, para cada intervalo de quadro de video correspondente, dezasseis destes valores de banda normalizados são introduzidos no módulo de geração de assinaturas 312, um para cada uma das dezasseis bandas de frequência. O módulo de geração de assinaturas 312 utiliza uma técnica de processamento AGORA-ENTÃO para produzir assinaturas áudio de dezasseis bits tais que cada bit de assinatura é obtido com base num valor actual (ou valor AGORA) de uma banda de frequências correspondente e um valor obtido anteriormente (ou valor ENTÃO) da mesma banda de frequências produzida a partir de um quadro que precede o quadro actual por um afastamento de quadro predeterminado. De forma mais especifica, os valores de banda de frequências normalizados recebidos são escritos numa memória temporária circular AGORA-ENTÃO e os valores ENTÃO são obtidos através da utilização dos afastamentos de quadro predeterminados. Os afastamentos de quadro podem variar de banda para banda. No entanto, de acordo com uma concretização vantajosa, um afastamento de quadro de 8 é utilizado para obter valores ENTÃO para cada uma das dezasseis bandas de frequência. O módulo de geração de assinaturas 312 produz um valor DVAL para cada banda de frequências de acordo com a seguinte relação: DVAL = (AGORA-ENTÃO)/(AGORA+ENTÃO) O valor de cada um dos 16 bits na assinatura de áudio para o quadro actual e os valores de bit de correspondente palavra máscaras são determinados de acordo com o valor DVAL. 52
ΕΡ 1 261 155 /PT
Isto é, um bit de assinatura é colocado a 0 se DVAL para a banda correspondente for maior do que 0, caso contrário é colocado num valor de 1. De modo semelhante, cada bit máscara é colocado num valor de 0 se o valor absoluto de DVAL para a banda correspondente for maior do que um valor predeterminado de banda de guarda GRDVAL. Por exemplo, se DVAL possuir um intervalo de 0 a 7FFF (Hex), um valor de banda de guarda de 600 (Hex) pode ser empregue, apesar de valores diferentes de GRDVAL poderem dar origem a resultados aceitáveis. A assinatura de áudio produzida e a sua correspondente palavra máscara para cada intervalo de quadro são de seguida introduzidas no processador de sinal digital áudio 264 como descrito anteriormente. É apreciado que a técnica acima para produção de assinaturas de áudio que compara valores de banda de frequências correspondentes deslocados no tempo para cada uma de uma pluralidade de bandas de frequência pode proporcionar vantagens sobre uma técnica que se baseie apenas em valores deslocados na frequência ou no tempo, uma vez que a técnica apresentada inclui relativamente mais informação numa dada assinatura e proporciona um melhor equilíbrio dos tipos de informação incluídos na assinatura.
SISTEMA PERICIAL O sistema pericial é um módulo de suporte lógico que está armazenado no computador de controlo 30 e inclui um número de "sub-módulos" ou programas identificados como sub-módulos de filtro de ocorrência, detecção de segmentos novos e nível de captura selectiva. Cada um destes sub-módulos contidos no sistema pericial será agora descrito em detalhe.
Filtro de ocorrência
Como referido anteriormente, dados de ocorrência de coincidência são introduzidos a partir de cada sítio local 16 no sítio central 12 para compilação no relatório 13 como ilustrado pela Fig. 1. Deste modo, deseja-se reduzir a quantidade de dados de falsa coincidência introduzidos a partir do sítio local 16 no sítio central 12 a fim de melhorar a precisão global do sistema 10 e minimizar o tempo 53
ΕΡ 1 261 155 /PT despendido pelos operadores de estação de trabalho no sítio central 12.
Basicamente, o sub-módulo de filtro de ocorrência recebe relatórios de coincidência do subsistema de reconhecimento de segmentos 26 e avalia quais, se algum, destes relatórios de coincidência recebidos é um relatório de coincidência errónea ou falsa. Estes relatórios de coincidência falsa detectada são então excluídos de uma base de dados do computador de controlo 30 para evitar transmissão de relatórios de coincidência falsa para o sítio central 12.
Para avaliar se um relatório de coincidência é erróneo, o filtro de ocorrência examina cada um dos relatórios de coincidência recebidos do subsistema de reconhecimento de segmentos 26 de acordo com uma pluralidade de regras predeterminadas. Um conjunto preferido destas regras predeterminadas será agora descrito com referência ao fluxograma ilustrado na Fig. 9.
Como mostrado no passo S10 da Fig. 9, é realizada uma determinação como se a coincidência recebida fosse definitivamente aceitável. Uma coincidência é determinada como sendo definitivamente aceitável se a mesma satisfizer, pelo menos, uma de duas condições, isto é (1) uma coincidência é definitivamente aceitável se tanto a assinatura de áudio como a assinatura de vídeo para o respectivo segmento tiverem correspondido, ou (2) se tanto o início como o fim do respectivo segmento estiverem temporariamente alinhados com "marcas de sinalização". Uma marca de sinalização, como empregue no filtro de ocorrência, é uma característica do sinal recebido diferente da coincidência particular que está a ser avaliada pelo filtro de ocorrência. Exemplos de marcas de sinalização fortes, como empregues pelo filtro de ocorrência, são um desvanecimento para preto (especialmente um desvanecimento para preto de um sinal de vídeo), bem como uma coincidência de um segmento de sinal imediatamente anterior ou sucessor. Se a coincidência recebida for determinada como definitivamente aceitável no passo S10, isto é, a coincidência satisfaz uma das condições descritas anteriormente, o resultado da coincidência é 54
ΕΡ 1 261 155 /PT armazenado na base de dados do computador de controlo 30, como indicado no passo S20.
Se, por outro lado, a coincidência não for determinada como sendo definitivamente aceitável, como indicado por um NÃO no passo S10, então é realizada uma determinação como se a coincidência fosse "definitivamente" inaceitável, como indicado no passo S30. Uma coincidência é determinada como sendo definitivamente inaceitável se a coincidência não for definitivamente aceitável (como determinado no passo S10), se a mesma não possuir uma marca de sinalização forte em qualquer extremidade dos segmentos correspondentes e se o seu segmento correspondente se sobrepuser, de forma substancial, a qualquer segmento com uma coincidência que seja determinada como definitivamente aceitável. Se a coincidência for determinada como sendo definitivamente inaceitável, então a coincidência é rejeitada como indicado no passo S40 e, em consequência, informação relativa a coincidência não é armazenada na base de dados do computador de controlo 30.
No entanto, se a coincidência não for definitivamente inaceitável, como indicado por um NÃO no passo S30, é realizada uma determinação no passo S50 como se o respectivo segmento possuísse uma marca de sinalização forte numa extremidade. Se for determinado que o respectivo segmento possui uma marca de sinalização forte numa extremidade do mesmo, então a coincidência recebida é sujeita a confirmação de coincidência como indicado pelo passo S60, o qual é descrito em maior detalhe abaixo. Nesta situação, uma tolerância menos rígida é utilizada durante a confirmação de coincidência quando comparada com a empregue num passo S90, como descrito de seguida. Isto é, o processo de confirmação de coincidência do passo S60 determina uma coincidência entre assinaturas com erros de coincidência relativamente maiores do que no caso do passo S90 de modo que uma coincidência é mais provável de ser aceite no passo S60. O resultado do processo de confirmação de coincidência determina se a coincidência se destina a ser rejeitada ou se destina a ser aceite.
Se, por outro lado, o respectivo segmento não possuir uma marca de sinalização forte numa extremidade como indicado 55
ΕΡ 1 261 155 /PT por um NÃO no passo S50, então é realizada uma determinação, no passo S70, se o respectivo segmento se ajustar a um perfil de segmentos cuja coincidência é tipicamente falsa. Se o respectivo segmento se ajustar a um perfil deste tipo de segmentos cuja coincidência é falsa, então, como indicado no passo S80, a coincidência é rejeitada e a informação relativa à coincidência não é armazenada na base de dados do computador de controlo 30.
Para determinar se um respectivo segmento se ajusta a um perfil de segmentos cuja coincidência é falsa, é determinado uma classificação R de coincidência falsa para o respectivo segmento. Esta classificação de coincidência falsa é determinada pela combinação de classificações numéricas associadas com as caracteristicas respectivas de uma pluralidade de caracteristicas de uma forma linear. Estas caracteristicas de preferência incluem o seguinte: 1. o comprimento L do respectivo segmento: segmentos com um comprimento relativamente curto são provavelmente para coincidência falsa; 2. entropia da assinatura de chave E: a entropia de uma assinatura de chave é uma medida da dissimilitude entre as palavras de coincidência na assinatura de chave e relaciona-se de forma inversa com a correlação entre as mesmas. A entropia de assinatura de chave é determinada por um gerador de assinatura de chave, como descrito aqui de seguida e é depois proporcionada a partir do subsistema de reconhecimento de segmentos 26 em conjunto com o correspondente relatório de coincidência. Assinaturas de chave com uma entropia relativamente baixa são mais prováveis de coincidência falsa do que aquelas que possuem uma entropia relativamente elevada; 3. limiar de erro T do dispositivo de correlação: segmentos com um limiar de erro relativamente elevado são de provável coincidência falsa; 4. distância D da falta de coincidência: coincidências com contagens de erro do dispositivo de correlação real que estejam próximas do limiar de erro do dispositivo de 56
ΕΡ 1 261 155 /PT correlação destinam-se provavelmente a ser coincidências falsas; e 5. se (M) a coincidência a ser avaliada se basear num sinal de video ou áudio: uma coincidência baseada num sinal de video é mais provável de coincidência falsa do que uma coincidência áudio baseada num sinal áudio.
De acordo com uma concretização de um método para produção de uma classificação de coincidência falsa, valores numéricos entre zero e um são atribuídos às caracteristicas L, E, T e D (a caracteristica M não é utilizada neste exemplo) e uma combinação linear dos valores atribuídos é formada para produzir a classificação de coincidência falsa R, como se segue:
R =· w^L + w2E + w3T + w4D em que wi até w4 são os respectivos pesos numéricos atribuídos a cada uma das caracteristicas para determinação da sua importância relativa na determinação da classificação de coincidência falsa R, e os valores das caracteristicas L, E, T e D foram convertidos para uma escala normalizada de zero a um. No caso de um sistema de reconhecimento de mensagens comerciais televisivas, em que valores mais elevados de R representam uma probabilidade relativamente inferior de uma coincidência falsa, valores exemplificativos podem ser atribuídos à caracteristica L como ilustrado na Tabela II abaixo.
Tabela II
Comprimento de segmento (em segundos) L 10 0,0 15 0,30 20 0,40 30 0,80 45 0,95 60 ou mais 1,00
Neste exemplo, a entropia E é medida numa escala de zero a 256, em que 256 representa a entropia máxima. Valores 57 ΕΡ 1 261 155 /PT normalizados exemplificativos para E são ilustrados na Tabela III abaixo.
Tabela III
Entropia E 130 0,0 135 0,10 140 0,20 145 0,50 150 0, 70 160 0, 80 170 1,00
Consequentemente, quanto maior o valor de entropia, mais elevado o valor atribuído a E, o que reflecte a reduzida probabilidade de uma coincidência falsa para maiores valores de entropia.
Além disso, neste exemplo, é atribuída à característica T que representa o limiar de erro e o intervalo de 20 a 60 os valores de zero a um de acordo com a Tabela IV abaixo.
Tabela IV
Limiar de erro T 20 1,0 30 0, 90 40 0, 70 50 0, 40 55 0, 25 60 0, 0
Como reflectido pela Tabela IV, a valores mais elevados do limiar de erro são atribuídos valores T relativamente inferiores, o que reflecte a probabilidade relativamente inferior de uma coincidência falsa para limiares de erro mais elevados.
Valores exemplificativos para a característica D que representa a diferença entre a contagem de erro do 58 ΕΡ 1 261 155 /PT dispositivo de correlação real e o limiar de erro são atribuídos valores de acordo com Tabela V abaixo.
Tabela v
Distância para falta de coincidência D 1 0,0 2 0,20 3 0,30 4 0,50 5 0,80 6 1,0
Isto é, quanto maior a diferença entre a contagem de erro do dispositivo de correlação real e o limiar de erro, menor é a probabilidade de uma coincidência falsa.
Finalmente, neste exemplo, aos pesos wi, até w4 são atribuídos os valores listados na Tabela VI abaixo.
Tabela vi
Peso Valor Wi 0, 25 W2 0, 40 w3 0,175 w4 0, 175
Será visto que a soma dos pesos é seleccionada como 1,00. Por conseguinte, desde que os valores de L, E, T e D tenham sido, cada um, normalizados de modo que cada um fique num intervalo entre zero e um, a classificação de coincidência falsa R do mesmo modo ficará no intervalo entre um valor baixo de zero (que representa a elevada probabilidade de uma coincidência falsa) e um valor elevado de um (que representa a baixa probabilidade de uma coincidência falsa).
No passo S70, se o respectivo segmento não se ajustar ao perfil de segmentos de coincidência falsa, como indicado por um NÃO no passo S70, então a coincidência correspondente está sujeita a confirmação de coincidência como indicado no passo S90. As tolerâncias utilizadas para a confirmação de 59
ΕΡ 1 261 155 /PT coincidência do passo S90 são mais apertadas do que as utilizadas no passo S60, como assinalado anteriormente. Além disso, como no passo S60, os resultados do processo de confirmação de coincidência no passo S90 determinam se a respectiva coincidência se destina a ser aceite e, deste modo, armazenada na base de dados do computador de controlo 30, ou se destina a ser rejeitada.
Outra função do filtro de ocorrência é determinar se a coincidência recebida pode ser utilizada como uma marca de sinalização para localização de segmentos novos ou alinhamento de outras coincidências. Basicamente, o processo utilizado para decidir se uma coincidência se destina a ser utilizada como uma marca de sinalização é, de forma substancial, o mesmo que o descrito acima na determinação se uma coincidência é aceitável. No entanto, existem duas excepções. Isto é, (1) uma coincidência que parece ser inaceitável e não está próxima de quaisquer marcas de sinalização fortes pode ser utilizada como uma marca de sinalização, no caso das coincidências seguintes poderem ser alinhadas com a mesma ou de outro modo se determinar um segmento novo com base numa coincidência seguinte e, (2) segmentos que possuam uma marca de sinalização forte numa extremidade mas possuam uma classificação elevada de coincidência falsa, como descrito acima, não são utilizados como marcas de sinalização. No entanto, em caso de excepção (2), se a confirmação de coincidência posterior indicar uma coincidência aceitável, então a coincidência pode ser reportada à base de dados. A memória temporária de armazenamento, contida no subsistema de captura de dados 28, retém apenas uma quantidade limitada, predeterminada, de dados. Consequentemente, o filtro de ocorrência de preferência funciona ou reage numa forma temporal de modo a permitir que os dados áudio e video sejam recolhidos para um segmento que necessita de uma captura deste tipo, por exemplo, um segmento novo com um nivel de captura 1 como descrito de seguida.
Em alguns casos, por exemplo, quando é necessário confirmação de coincidência (o que é relativamente consumidor de tempo), a informação necessária para decidir se uma 60
ΕΡ 1 261 155 /PT coincidência é aceitável ou inaceitável não está muitas vezes, disponível na restrição de tempo imposta sobre o filtro de ocorrência. Isto é, toda a informação necessária para determinar se uma coincidência se destina ou não a ser aceite pode não estar disponível na altura em que o relatório de coincidência é fornecido ao computador de controlo 30. Para mitigar este problema, o filtro de ocorrência toma uma decisão preliminar como se a coincidência correspondente ao respectivo segmento devesse ser aceite na altura em que a coincidência é reportada. Se uma coincidência é determinada preliminarmente como aceitável (ou é finalmente determinada como aceitável), é reportada à base de dados, enquanto que se a coincidência for inaceitável, a mesma é retirada da base de dados. Os resultados das decisões preliminares são revistos depois de um período de tempo predeterminado, por exemplo, aproximadamente vários minutos. Durante este período de tempo predeterminado, o processo de confirmação de coincidência é concluído. Com base nos resultados de confirmação de coincidência, se uma coincidência que não foi anteriormente introduzida na base de dados do computador de controlo 30 for agora determinada como sendo aceitável, a mesma será introduzida na base de dados como uma coincidência aceitável. Por outro lado, se uma coincidência que foi anteriormente determinada como sendo aceitável e, como tal, foi reportada para a base de dados for agora determinada como sendo inaceitável, um sinal de anulação de coincidência é produzido para anular a correspondente coincidência. Em geral, coincidências que foram inicialmente determinadas como sendo definitivamente aceitáveis ou inaceitáveis não são revistas no tempo posterior predeterminado uma vez que a sua determinação não está em dúvida. No entanto, quando é determinada uma coincidência de assinatura de vídeo ou áudio como sendo definitivamente inaceitável antes de uma coincidência ser determinada para a outra assinatura de vídeo ou áudio correspondente, a coincidência da primeira assinatura será apesar disso aceite uma vez que as correspondentes assinaturas de vídeo e áudio corresponderam.
Deste modo, com referência novamente à Fig. 3, o filtro de ocorrência do sistema pericial 414 recebe relatórios de coincidência do subsistema de reconhecimento de segmentos 26 e determina se estes relatórios são relatórios de 61
ΕΡ 1 261 155 /PT coincidência falsa. Em certas situações, como explicado acima, a confirmação de coincidência pode ser necessária, após o que o módulo de confirmação de coincidência 422, que utiliza o subsistema de reconhecimento de segmentos 26 bem como assinaturas de chave da base de dados 412 determina se a coincidência é aceitável ou não. Os resultados da confirmação de coincidência são introduzidos, num período de tempo predeterminado, no filtro de ocorrência. 0 filtro de ocorrência fornece à base de dados 412 coincidências que são determinadas como sendo aceitáveis. Se o filtro de ocorrência tiver proporcionado anteriormente uma coincidência à base de dados que posteriormente é determinada como sendo inaceitável, o filtro de ocorrência fornece um sinal de anulação de coincidência ao controlo da base de dados 416 para anular a respectiva coincidência da mesma.
Confirmação de coincidência 0 módulo de confirmação de coincidência está localizado no computador de controlo 30 (Fig. 2) e é utilizado para avaliar coincidências de aceitabilidade questionável no pedido do filtro de ocorrência sob as condições descritas acima. Como um exemplo, em certas situações, as sub-assinaturas de áudio ou vídeo mas não em ambas, podem corresponder. Neste exemplo, o filtro de ocorrência pode solicitar confirmação de coincidência para decidir se as sub-assinaturas que não corresponderam inicialmente no controlador de reconhecimento seriam, apesar disso, vistas como correspondendo a uma dada assinatura de chave quando comparadas com a mesma sob normas que são mais tolerantes a erros de coincidência. O módulo de confirmação de coincidência concretiza um processo de coincidência que é semelhante ao utilizado pelo dispositivo de correlação 420 (Fig. 3) no subsistema de reconhecimento de segmentos 26. No entanto, ao contrário do dispositivo de correlação que está a tentar fazer corresponder palavras-chave em comparação com uma sequência contínua de assinaturas de áudio e vídeo, o módulo de confirmação de coincidência está a tentar fazer corresponder apenas um curto comprimento de um segmento de difusão em comparação com uma assinatura de chave. Em consequência, 62
ΕΡ 1 261 155 /PT coincidência falsa é menos provável de ocorrer com confirmação de coincidência do que com o processo de coincidência realizado pelo dispositivo de correlação. Consequentemente, as tolerâncias de erro para o processo de confirmação de coincidência podem ser consideravelmente reduzidas ou aliviadas quando comparadas com as empregues no processo de coincidência do dispositivo de correlação, sem que resultem numa taxa de coincidência falsa inaceitável. Este alivio de tolerâncias de erro permite que o módulo de confirmação de coincidência determine se uma assinatura ou sub-assinatura devesse ter correspondido mesmo apesar do dispositivo de correlação ter sido incapaz de o determinar.
Referindo novamente a Fig. 3, um pedido de confirmação de coincidência pode ser introduzido a partir do módulo do filtro de ocorrência do sistema pericial 414 no módulo de confirmação de coincidência 422. Este pedido pode incluir o número de identificação de segmento, os instantes de início e fim do segmento, o canal de emissão e uma tolerância de confirmação de coincidência desejada. Após a recepção de um sinal de pedido de coincidência deste tipo, o módulo de confirmação de coincidência solicita os dados de assinatura do segmento para os instantes solicitados a partir do subsistema de reconhecimento de segmentos 26 e a assinatura de chave relevante da base de dados 412. Depois da recepção da informação solicitada, o módulo de confirmação de coincidência 422 então compara a única assinatura de chave com a porção ou segmento solicitados do sinal de difusão de acordo com a tolerância de confirmação de coincidência desejada e, após a conclusão da comparação, fornece o resultado (isto é uma coincidência ou não coincidência) ao módulo do filtro de ocorrência. 0 módulo de confirmação de coincidência realiza a comparação movendo de forma eficaz a assinatura de chave ao longo da assinatura de segmento como mostrado na Fig. 10. Essencialmente, a assinatura de chave é alinhada com a assinatura de segmento numa posição inicial numa zona de coincidência esperada e uma coincidência é tentada de acordo com o processo de confirmação de coincidência descrito abaixo. Cada uma de uma multiplicidade de confirmações de coincidências também é tentada por alinhamento da assinatura 63
ΕΡ 1 261 155 /PT
de chave em afastamento de posições correspondentes da posição original, respectivamente, por ±1, 2, 3, ... , N quadros. Isto é, na Fig. 10, N representa o número de quadros que se destinam a ser verificados em qualquer lado de uma localização na zona de coincidência esperada, m(0) representa a palavra-chave respectiva (que na confirmação de coincidência é tratada simplesmente como outra palavra de coincidência), e m(x) representa a xesima palavra de coincidência em que 1 < x < 8. De um modo geral, o módulo de confirmação de coincidência calcula uma contagem total de erros minima entre todas das 2N+1 tentativas de coincidência que o mesmo compara com a soma dos limiares de erro atribuídos de forma permanente à assinatura de chave e uma tolerância de confirmação de coincidência para tomar uma decisão se existe uma coincidência.
De forma mais especifica, apesar do algoritmo utilizado pelo módulo de confirmação de coincidência corresponder com o utilizado pelo dispositivo de correlação 420 na maior parte dos aspectos, existem certas diferenças. Estas diferenças serão agora descritas com referência à Fig. 10.
Para cada confirmação de coincidência tentada, uma respectiva contagem parcial de erro p é produzida para cada palavra de coincidência de assinatura de chave, por comparação com a palavra de coincidência com a assinatura de quadro correspondente a partir da assinatura de segmento. Uma contagem total de erros é então determinada através da soma do número R (que possui um valor exemplificativo de 8) das contagens parciais de erros inferiores para cada coincidência tentada. Na concretização preferida, uma vez que a palavra-chave é considerada simplesmente como outra palavra de coincidência, a respectiva assinatura de chave contém nove palavras de coincidência. Deste modo, no cálculo da contagem total de erros para cada coincidência tentada, a contagem parcial de erros com a contagem de erro mais elevada (ou pior) não é utilizada. A contagem total de erros para cada coincidência tentada é calculada para os N quadros tanto antes como depois da localização original como mostrado na Fig. 7. O valor de N deverá ser cuidadosamente seleccionado, uma vez que se N for demasiado elevado pode dar origem a falsa coincidência e, por outro lado, um valor de N que seja 64
ΕΡ 1 261 155 /PT demasiado pequeno pode não detectar coincidências aceitáveis. Na concretização preferida, N possui um valor de 60. A contagem de erro total com o valor mais baixo é seleccionada como a contagem de erro final. A contagem de erro final é então ajustada para quantificar qualquer contagem de erro parcial descartada. Numa concretização vantajosa, este ajuste é realizado através da utilização da seguinte relação:
Contagem de erros final ajustada = (contagem de erros final) (8/R) O módulo de confirmação de coincidência aumenta a contagem de erro ou limiar de erro associado com a assinatura de chave através da contagem de erro especificada pela tolerância de confirmação de coincidência para obter um valor de limiar de erro. O módulo de confirmação de coincidência então compara a contagem de erro final ajustada com o valor de limiar de erro. Se a contagem de erro final ajustada for inferior ou igual ao valor de limiar de erro, uma coincidência é determinada como existente, após o que um sinal que o indica é enviado do módulo de confirmação de coincidência para o módulo do filtro de ocorrência. Se, por outro lado, a contagem de erro final ajustada for maior do que o valor de limiar de erro, então uma coincidência não é determinada como existente, após o que um sinal que o indica é introduzido no módulo do filtro de ocorrência.
Detecção de segmentos novos A decisão se um segmento novo de interesse (por exemplo, uma mensagem comercial) foi recebido é utilizada para determinar a informação proporcionada aos operadores de estações de trabalho para identificação destes segmentos novos. Referindo novamente a Fig. 1, se o sitio local 16 identificar segmentos como segmentos novos completos de interesse, quando de facto os mesmos o não são (em cujo caso os mesmos são referidos como "residuais"), o tempo do operador de estação de trabalho é desperdiçado a tentar identificar estes segmentos. Se o sitio local 16 não delinear de forma correcta o segmento, para que, por exemplo, apenas uma porção da informação video e áudio para o segmento novo de interesse seja proporcionada ao operador, o tempo do 65
ΕΡ 1 261 155 /PT operador pode também ser desperdiçado e a precisão do sistema é reduzida. A detecção de segmentos novos é concretizada pelo sistema pericial e é principalmente com base em várias marcas de sinalização explicitas e implícitas. Marcas de sinalização explícitas são normalmente recebidas do subsistema de reconhecimento de segmentos 26 e podem, por exemplo, incluir desvanecimento de vídeo para preto, relatórios de sub-coincidência, silenciamento de áudio e alterações de cena. Por outro lado, um exemplo de uma marca de sinalização implícita é a duração do segmento. Cada uma destas marcas de sinalização será agora descrita em maior detalhe seguida por uma explicação do funcionamento do módulo de detecção de segmentos novos.
Tipicamente, são difundidas mensagens comerciais com, pelo menos, um campo de vídeo com um nível de preto substancial em cada extremidade. Uma vez que uma mensagem comercial pode possuir apenas um campo de preto em cada extremidade da mensagem comercial, um desvanecimento para preto em qualquer campo do sinal de vídeo é reportado pela respectiva carta de canal para o módulo de detecção de segmentos novos através do controlador de reconhecimento de segmentos. Deste modo, uma fronteira de mensagem comercial pode ser indicada por um desvanecimento para preto, em que a fronteira está normalmente no início ou no fim deste desvanecimento para preto. No entanto, em alguns casos, a fronteira da mensagem comercial real pode estar localizada no meio de um desvanecimento para preto. Isto pode ocorrer se cenas próximas de preto forem detectadas como sendo pretos ou se durante um desvanecimento para preto real, o sinal de vídeo começar a desvanecer para a mensagem comercial seguinte antes de permitir que o desvanecimento para preto esteja concluído. Apesar destes desvanecimentos para preto ocorrerem ocasionalmente os quais não correspondem com fronteiras de mensagem comercial e que podem ser detectados pelo módulo de detecção de segmentos novos, o número destes desvanecimento para preto espúrios é relativamente baixo quando comparado com o número destes silenciamentos de áudio ou alterações de cena, que são descritos de seguida.
ΕΡ 1 261 155 /PT 6 6
Uma coincidência que tenha sido aceite pelo filtro de ocorrência do sistema pericial é utilizada como marca de sinalização. Como referido anteriormente, apesar do subsistema de reconhecimento de segmentos 26 poder produzir relatórios de coincidência falsa, o filtro de ocorrência serve para identificar e eliminar um número substancial de relatórios de coincidência falsa. Em consequência, uma coincidência que é determinada como sendo aceitável pelo filtro de ocorrência é uma marca de sinalização fiável. Uma coincidência deste tipo também é considerada como uma marca de sinalização relativamente muito forte quer isolada quer especialmente em combinação com um desvanecimento para preto em qualquer ou ambas as extremidades de um segmento em consideração. Por exemplo, uma vez que as mensagens comerciais são tipicamente difundidas em grupos, ou ficheiros de áudio, tais que a extremidade de uma mensagem comercial corresponde ao inicio de uma mensagem comercial subsequente, a determinação de uma coincidência aceitável é uma indicação forte de que uma mensagem comercial se segue. Uma coincidência que seja determinada como sendo aceitável também é uma importante marca de sinalização para informar o sistema pericial onde não encontrar um novo segmento de interesse. Como um exemplo, o módulo de detecção de segmentos novos não irá pesquisar segmentos novos em segmentos que já tenham tido uma coincidência aceitável. Isto é, ao contrário de um segmento novo, um segmento que já tenha tido uma coincidência aceitável associada com o mesmo pelo sistema pericial, não necessita de ser enviado para uma das estações de trabalho 14 para classificação por um operador como descrito anteriormente (uma vez que esta classificação já foi obviamente realizada para que uma coincidência tenha sido detectada).
Apesar da extremidade de uma coincidência aceitável normalmente representar quer o início de um segmento subsequente quer o início de um desvanecimento para preto que representa a fronteira verdadeira, a marca de sinalização de coincidência pode não ser conhecida, de forma precisa, no tempo. Uma vez que podem ocorrer coincidências em vários quadros consecutivos, cada coincidência (áudio e vídeo) possui uma largura de pico associada à mesma que é proporcional à incerteza no tempo para a respectiva 67 ΕΡ 1 261 155 /PT coincidência. Para compensar esta incerteza, o módulo de detecção de segmentos novos tenta alinhar a respectiva coincidência através da utilização de outras marcas de sinalização fortes, tais como outra coincidência aceitável ou um desvanecimento para preto, sempre que possível.
As coincidências com base em números de identificação temporários (ID's) podem representar segmentos que podem diferir dos segmentos representados pelas coincidências que se baseiam em ID's permanentes. Isto é, coincidências com base em lD's temporários (que tenham sido classificadas por um operador de estação de trabalho) podem representar apenas uma porção de um segmento, enquanto que coincidências com base em id's permanentes foram vistas e analisadas de forma correcta por um operador numa das estações de trabalho 14. 0 módulo de detecção de segmentos novos do sistema pericial, de preferência, diferencia entre coincidências obtidas com assinaturas que possuem os diferentes tipos de ID's para aplicar maior peso a coincidências obtidas com assinaturas de ID permanentes.
Um silenciamento de áudio que representa uma redução do sinal áudio, de forma substancial, para um nível que representa silêncio, tipicamente ocorre em fronteiras de mensagens comerciais. No entanto, uma vez que silenciamentos de áudio são muito comuns ao longo de uma mensagem comercial bem como em segmentos de mensagem não comerciais tais como programação normal, um grande número de silenciamentos de áudio não indicam uma fronteira de mensagem comercial. Consequentemente, basear em silenciamentos de áudio a detecção das duas extremidades de um segmento pode conduzir à selecção de quantidades significativas de programação normal como segmentos de interesse, ou, pelo contrário, a divisão incorrecta de uma mensagem comercial em dois segmentos parciais, nenhum dos quais correspondendo de forma correcta no futuro uma vez que o seu comprimento é registado incorrectamente. Deste modo, um silenciamento de áudio é considerado um marca de sinalização relativamente mais fraca do que o desvanecimento para preto descrito anteriormente ou uma marca de sinalização de coincidência aceitável. Em consequência, a utilização de um silenciamento de áudio como marca de sinalização necessita de ser restringida ou, caso 68
ΕΡ 1 261 155 /PT contrário, serão gerados resíduos excessivos. Além disso, quando um silenciamento de áudio indica uma fronteira de mensagem comercial, a fronteira pode não ficar exactamente no início ou no fim do silenciamento de áudio, mas pelo contrário pode ficar nalguma localização indefinida no silenciamento de áudio. Em consequência, longos silenciamentos de áudio tipicamente não podem ser utilizados como marcas de sinalização devido à incerteza da localização exacta do início ou fim da mensagem comercial.
Uma alteração de cena é uma alteração abrupta na figura de vídeo que ocorre entre quadros. Uma vez que alterações de cena nos segmentos são comuns, além das que ocorrem nas fronteiras da mensagem comercial, uma alteração de cena é considerada uma marca de sinalização relativamente fraca. Apesar disso, alterações de cena podem ser muito úteis. Por exemplo, muitas mensagens comerciais que não possuem um desvanecimento para preto numa fronteira possuem uma alteração de cena naquele ponto. Apesar da alteração de cena por si própria ser uma marca de sinalização fraca como referido anteriormente, a alteração de cena pode ser combinada com um silenciamento de áudio para formar uma marca de sinalização mais forte. Por exemplo, a alteração de cena pode ser utilizada para localizar a fronteira da mensagem comercial num silenciamento de áudio.
Marcas de sinalização implícitas
Uma das marcas de sinalização implícitas mais importantes é a duração do segmento. Tipicamente, mensagens comerciais são difundidas em comprimentos nominais ou padrão, por exemplo, comprimentos de 10, 15, 20, 30, 45, 60, 90 ou 120 segundos. Alguns destes comprimentos de mensagem comercial ocorrem com maior frequência do que outros. Em particular, crê-se que mensagens comerciais de 30 segundos ocorrem com maior frequência. Crê-se que a frequência de ocorrência dos vários comprimentos de mensagem comercial é representada como se segue, em que a frequência de ocorrência de uma mensagem comercial de duração t (em segundos) é representada como CLt: CL30 > > CL15 > > CL10 > CL60 > [CL20, CLi20f CLgo, CL45] 69
ΕΡ 1 261 155 /PT
Isto é, como um exemplo, mensagens comerciais com um comprimento de 10 segundos crê-se que ocorram com maior frequência do que mensagens comerciais com um comprimento de 60 segundos. Os intervalos dos comprimentos que ocorrem com mais frequência são considerados para proporcionar marcas de sinalização mais fortes do que os associados com os comprimentos que ocorrem com menos frequência. O desvio do comprimento de segmento nominal também é parte da marca de sinalização de duração de segmento. De forma mais especifica, as mensagens comerciais ou segmentos de interesse raramente estão em conformidade com os comprimentos nominais destes segmentos (por exemplo, 30 s, 15 s, etc.). Pelo contrário, as mesmas são normalmente ligeiramente mais curtas ou mais compridas do que o correspondente comprimento nominal. Tipicamente, um segmento é mais curto em vez de mais comprido que o correspondente comprimento nominal. Isto é, uma vez que cada mensagem comercial ou segmento de interesse é produzido para se ajustar a um bloco de tempo predeterminado, é consideravelmente menos incómodo possuir o segmento de interesse ligeiramente mais pequeno do que o comprimento nominal após o que quadros (tais como desvanecimentos para preto) podem ser adicionados, em vez de editar o segmento de interesse para ajustar ao comprimento de bloco predeterminado. Segmentos que sejam mais compridos do que o correspondente comprimento nominal são normalmente o resultado de erros que ocorrem quer na estação de emissão quer na estação de recepção. Por exemplo, crê-se que um desvio de comprimento mais provável para um novo segmento de interesse esteja entre aproximadamente 0,0 e -0,2 segundos com um pico localizado em aproximadamente -0,13 segundos. Tipicamente, para um respectivo segmento, quanto mais se desviar o comprimento do segmento do comprimento nominal de pico, menor a probabilidade do segmento ser um segmento de interesse. Como é apreciado, a probabilidade de um segmento ser um segmento de interesse diminui rapidamente à medida que o comprimento do segmento aumenta sobre o comprimento nominal.
Uma vez que, como referido anteriormente, as mensagens comerciais ou segmentos de interesse são tipicamente 70
ΕΡ 1 261 155 /PT difundidas em grupos ou ficheiros de áudio, quando um segmento novo é detectado, isso indica que outros segmentos novos podem estar adjacentes ao mesmo. Por conseguinte, um segmento novo detectado é uma marca de sinalização para detecção de outros segmentos novos. No entanto, a resistência do segmento novo enquanto marca de sinalização depende da probabilidade do segmento novo ser um novo segmento de interesse o qual, por sua vez, depende das marcas de sinalização em que se baseia o segmento novo.
Assume-se que a probabilidade de detectar que um segmento novo com um comprimento predeterminado, com certas marcas de sinalização, não corresponda a um segmento de interesse (ou por outras palavras um segmento residual) é relativamente independente do comprimento seleccionado. Como referido anteriormente, a interpretação de segmentos residuais como segmentos novos de interesse aumenta o tempo de processamento do sistema 10 (Fig. 1) e, deste modo, aumenta o custo global de funcionamento do sistema. Deste modo, é desejável seleccionar segmentos como possíveis segmentos novos de interesse com intervalos de tempo ou comprimentos de segmento que sejam prováveis de corresponder a segmentos novos de interesse.
Considera-se, por conseguinte, ser mais produtivo despender tempo do operador à procura de segmentos com um comprimento de 30 segundos os quais, como referido anteriormente, se crê serem comuns, do que despender tempo do operador à procura de segmentos com um comprimento de 45 segundos os quais não se crê que ocorram tão frequentemente. Embora esta atribuição de tempo do operador signifique que um segmento novo de 45 segundos é menos provável de ser detectado do que um segmento novo de 30 segundos, o resultado é uma precisão global do sistema relativamente elevada com minimização de custos de funcionamento. A Fig. 11 ilustra o fluxo de sinal na concretização do processo de detecção. Um sinal de difusão desejado num dado canal é recebido por um dos respectivos conversores 24 e convertido em sinais áudio e vídeo de banda base que são introduzidos na carta de canal 402. A carta de canal 402 fornece marcas de sinalização que pertencem ao segmento novo 71 ΕΡ 1 261 155 /PT de interesse ao controlador de reconhecimento de segmentos 404 que também recebe informação de coincidência do dispositivo de correlação 420. As marcas de sinalização em conjunto com relatórios de coincidência são introduzidas a partir do controlador de reconhecimento de segmentos 404 no sistema pericial 414. O sistema pericial 414 examina a informação recebida para determinar se possíveis segmentos novos indicados pelas marcas de sinalização são segmentos novos de interesse. Se qualquer dos segmentos indicados for determinado como sendo um segmento novo de interesse, o sistema pericial 414 fornece um sinal ao controlador de reconhecimento de segmentos 404 a solicitar a respectiva assinatura de segmento que é então recolhida e fornecida ao sistema pericial. Após recepção pelo sistema pericial, esta assinatura de segmento novo é introduzida através do controlo da base de dados 416 na base de dados 412. Mais sinais associados fornecidos pelo sistema pericial para a base de dados 412 incluem o tempo de ocorrência, o canal, o número de identificação de segmento, a assinatura de chave e os valores de limiar de áudio e video. Além disso, em certas situações, como descrito anteriormente, o sistema pericial 414 pode fornecer um sinal de valor de limiar ou captura A/V inicial ao controlo da base de dados 416 antes da determinação de um valor de limiar final. Se, nestas situações, for posteriormente determinado que o valor de limiar inicial estava incorrecto, o sistema pericial 414 fornece uma alteração de valor de limiar ou sinal de anulação ao controlo da base de dados 416 para corrigir a entrada na base de dados 412. A operação do módulo de detecção de segmentos novos será agora explicada.
De acordo com um modo de operação, o módulo de detecção de segmentos novos explora as marcas de sinalização num sinal recebido para detectar um segmento com um comprimento padrão para um segmento de interesse. O primeiro segmento detectado que possua um intervalo deste tipo e satisfaça critérios predeterminados descritos abaixo é aceite como um segmento novo de interesse. Uma vez aceite o primeiro intervalo que satisfaça estes requisitos, segmentos novos subsequentes que possam entrar em conflito com os mesmos (isto é, outro 72
ΕΡ 1 261 155 /PT segmento que ocorra durante o mesmo período de tempo) não são considerados. Por conseguinte, o segmento que for detectado e aceite é dependente da ordem em que as marcas de sinalização forem exploradas como descrito de seguida.
As marcas de sinalização são armazenadas numa fila de dupla extremidade de marcas de sinalização em que um nó é estabelecido de cada vez que existe uma transição ligado-deslicado ("on-off") de qualquer das marcas de sinalização. Estes nós são ordenados por tempo. Coincidências são introduzidas na fila de dupla extremidade pelo filtro de ocorrência quando as mesmas são determinadas como sendo aceitáveis para utilização como marcas de sinalização. Estas marcas de sinalização são então exploradas quer por especificação de uma localização de início na fila de dupla extremidade quer por uma especificação de tempo desejado. Se for fornecido um tempo, o último ponto na fila de dupla extremidade que ocorreu depois de um atraso de tempo fixo, predeterminado (por exemplo, aproximadamente 80 segundos) é utilizado como o tempo de exploração inicial para compensar o atraso em reportar coincidências enquanto comparadas com os relatórios de marcas de sinalização.
As marcas de sinalização podem ser exploradas por mais do que uma passagem e, numa concretização preferida, são utilizadas duas passagens. A primeira passagem explora todas as marcas de sinalização excepto silenciamentos de áudio e a segunda passagem explora as marcas de sinalização para segmentos baseados em silenciamento de áudio. Este processo de exploração será agora descrito de forma mais completa.
As marcas de sinalização são exploradas para trás no tempo através da utilização de dois ciclos ligados. Noutro ciclo, a fila de dupla extremidade é explorada para trás para marcas de sinalização adequadas para a cauda (ou extremidade) de um segmento e num ciclo interno a fila de dupla extremidade é explorada para trás a partir da posição de cauda actual na pesquisa de marcas de sinalização adequadas para o início de um segmento novo. Desta forma, todos os possíveis segmentos novos que contenham uma marca de sinalização plausível em cada extremidade são detectados.
Cada um dos intervalos de tempo é avaliado para determinar 73
ΕΡ 1 261 155 /PT se, dado o respectivo comprimento e os tipos de marca de sinalização associados, o mesmo representa um novo segmento de interesse aceitável. Isto é, o módulo de detecção de segmentos novos determina, para um respectivo segmento, se os tipos de marca de sinalização são aceitáveis e então determina se o comprimento do segmento em combinação com estas marcas de sinalização indica um novo segmento de interesse aceitável.
Se um intervalo for indicado como sendo um novo segmento de interesse, ao mesmo é atribuído um número de identificação de segmento e é armazenado na fila de dupla extremidade de marcas de sinalização como uma ocorrência. Depois, um módulo de nível de captura selectiva é utilizado para determinar um valor de nível de captura áudio/vídeo adequado, como descrito de seguida. Além disso, uma assinatura de segmento é obtida do subsistema de reconhecimento de segmentos 26 e a respectiva assinatura é então introduzida na base de dados 412 do computador de controlo 30. A Fig. 12 ilustra os passos descritos acima realizados pelo módulo de detecção de segmentos novos. Como mostrado aqui, o processamento começa no passo S100 em que uma porção desejada da emissão recebida é examinada para localização de todos os intervalos entre marcas de sinalização. Depois, como mostrado no passo S110, cada um dos intervalos localizados no passo S100 é examinado de modo a determinar se as respectivas marcas de sinalização de início e fim são plausíveis. De seguida, como mostrado no passo S120, a aceitabilidade de cada intervalo que possua marcas de sinalização plausíveis nas suas respectivas extremidades é determinada com base no respectivo comprimento nominal do intervalo, no desvio deste comprimento nominal e na combinação das marcas de sinalização de início e fim. Se o intervalo for determinado como sendo aceitável, então como indicado no passo S130, o nível de captura de áudio/vídeo é determinado pelo módulo de nível de captura selectiva. De seguida, o segmento de interesse recentemente aceite é introduzido na base de dados 412 do computador de controlo 30 como mostrado no passo S140. Se, por outro lado, no passo S120, o respectivo intervalo ou segmento for rejeitado, então não é realizado processamento adicional para este segmento. 74
ΕΡ 1 261 155 /PT
Depois da localização de um segmento novo, o ciclo exterior é reiniciado de modo a continuar a partir do inicio do segmento recentemente detectado. 0 ciclo exterior termina após a determinação de uma marca de sinalização gue já tenha sido verificada como uma possível marca de sinalização de cauda. Isto pode ser determinado ao examinar sinalizadores de marcas de sinalização examinadas. Isto é, cada nó na fila de dupla extremidade que já tenha sido verificado como uma possível marca de sinalização de cauda possui um sinalizador de marca de sinalização examinada activado. Uma vez que, na concretização preferida, existem duas passagens de exploração, existem dois sinalizadores de marcas de sinalização examinadas. Por outro lado, o ciclo interior termina quando o mesmo localiza uma marca de sinalização separada no tempo a partir da marca de sinalização de cauda actual através de uma quantidade mais comprida do que a de qualquer segmento padrão (por exemplo, 120 segundos).
Duas passagens são utilizadas de modo que aos segmentos baseados em silenciamento de áudio possa ser dada uma prioridade inferior à dos outros segmentos. De forma mais específica, numa concretização preferida, a segunda passagem é num ponto de escrutínio 30 segundos mais tarde do que na primeira passagem, isto permite que a primeira passagem localize todos os segmentos até 30 segundos de comprimento que não se baseiam em marcas de sinalização de silenciamento de áudio antes da verificação de segmentos com base em silenciamento de áudio na segunda passagem. Em consequência, os segmentos com base em silenciamento de áudio de probabilidade inferior (ou menos provável de ser aceitável) não serão detectados antes da detecção de segmentos de interesse com uma probabilidade de ocorrência mais elevada, por exemplo, aqueles com base em coincidências e desvanecimentos para preto com comprimentos até 30 segundos. Como referido anteriormente, o primeiro segmento detectado pode ser utilizado sem consideração de quaisquer segmentos de possível conflito (apesar de ser preferível resolver estes conflitos, como descrito aqui abaixo). Numa situação deste tipo, é desejável utilizar as duas passagens como descrito anteriormente. Além disso, uma vez que a todos os segmentos com base em silenciamento de áudio é dado um nível de captura 2 pelo módulo de nível de captura selectiva como descrito de 75
ΕΡ 1 261 155 /PT seguida, de modo que os respectivos dados áudio e video não são recolhidos quando estes segmentos não tiveram sido encontrados anteriormente, o atraso na exploração pode ser ajustado para um valor ainda mais comprido. Isto iria também minimizar mais o bloqueamento de um segmento com base em probabilidade mais elevada por um segmento baseado em silenciamento de áudio. A determinação se uma marca de sinalização é adequada para o início ou fim de um segmento envolve consideração cuidadosa. Por exemplo, no caso de uma marca de sinalização de ocorrência, pode ser necessário garantir que uma marca de sinalização de ocorrência de início que pode ser útil como uma marca de sinalização de cauda não seja, ao mesmo tempo, a extremidade de outra ocorrência. Isto pode ser determinado por verificação de que sinalizadores de ocorrência de início e fim não estão activos ao mesmo tempo. Como outro exemplo, pode ser necessário determinar se um desvanecimento para preto está associado com uma ocorrência, após o que esta ocorrência pode ser utilizada para aumentar a resistência da marca de sinalização. Isto é, se o início de um desvanecimento para preto estiver sob consideração como uma marca de sinalização de cauda de segmento possível, então a extremidade do desvanecimento para preto deverá ser examinada para determinar se a mesma é o início de uma ocorrência associada. Se assim for, a resistência da marca de sinalização pode ser aumentada.
As caracteristicas utilizadas no módulo de detecção de segmentos novos descritas acima para determinar a aceitabilidade de um segmento como um novo segmento de interesse serão agora descritas de forma mais completa. 0 desvio máximo aceitável do comprimento nominal é determinado. No entanto, nesta determinação, os comprimentos nominais que ocorrem com mais frequência são favorecidos, ao munir os mesmos com tolerâncias de desvio relativamente grandes, para aumentar as hipóteses de detecção de um novo segmento de interesse. Tolerâncias separadas são de preferência utilizadas para desvios inferiores e superiores ao comprimento nominal, em que a tolerância para o desvio 76
ΕΡ 1 261 155 /PT inferior a um comprimento nominal é tipicamente maior do que a tolerância para o desvio superior ao comprimento nominal.
As marcas de sinalização para cada intervalo são utilizadas para ajustar o desvio máximo permissivel do comprimento nominal para o segmento em consideração. Isto é efectuado através da análise das marcas de sinalização nas extremidades do respectivo segmento para determinar qual das marcas de sinalização em cada extremidade é a mais forte. As marcas de sinalização de ocorrência são consideradas como sendo as mais fortes, seguidas por sua vez pelos desvanecimentos para preto e silenciamentos de áudio. Isto é, a tolerância é ajustada de acordo com a resistência das marcas de sinalização nas duas extremidades do segmento. A utilização não critica de silenciamentos de áudio como marcas de sinalização pode gerar um número relativamente grande de segmentos residuais. No entanto, segmentos com base em silenciamento de áudio podem ser aceitáveis com um silenciamento de áudio como uma marca de sinalização numa extremidade desde que uma marca de sinalização relativamente forte esteja presente na outra extremidade. Além disso, uma vez que silenciamentos de áudio com um comprimento relativamente pequeno ocorrem frequentemente e silenciamentos de áudio com um comprimento relativamente longo normalmente não permitem determinação precisa de extremidades de segmentos, são utilizados apenas silenciamentos de áudio com um comprimento que fique num intervalo predeterminado. Apesar disso, a todos estes segmentos com base em silenciamento de áudio é dado um nível de captura de 2 pelo módulo de captura selectiva. Para limitar mais o número de segmentos residuais detectados, apenas segmentos com um comprimento nominal com maior frequência de ocorrência são permitidos com base em silenciamentos de áudio como marcas de sinalização. Para além disso, enquanto segmentos com uma coincidência numa extremidade e um silenciamento de áudio na outra normalmente são aceitáveis, segmentos com um segmento recentemente detectado numa extremidade e uma coincidência na outra não são aceitáveis devido ao segmento recentemente detectado poder ser baseado numa marca de sinalização de silenciamento de áudio. Nesta situação, uma pluralidade de segmentos pode ser detectada como segmentos novos que se baseiam em marcas 77
ΕΡ 1 261 155 /PT de sinalização de silenciamento de áudio nas duas extremidades. Por conseguinte, segmentos com base em marcas de sinalização de ocorrência numa extremidade sem uma marca de sinalização forte adicional associada, por exemplo, uma marca de sinalização de desvanecimento para preto e uma marca de sinalização de silenciamento de áudio na outra extremidade podem não ser utilizados. 0 silenciamento de áudio pode ser utilizado na divisão de segmentos. Uma vez que as mensagens comerciais com um comprimento de 30 segundos ocorrem com maior frequência, num sistema de reconhecimento de mensagens comerciais televisivas, segmentos com comprimentos iguais a múltiplos do mesmo, por exemplo, 60, 90 ou 120 segundos, podem ser divididos numa pluralidade de segmentos cada um com um comprimento de 30 segundos. Estes segmentos podem ser divididos através da utilização do silenciamento de áudio para além de uma alteração de cena como marcas de sinalização divididas. Isto é, o segmento é examinado a cada intervalo de 30 segundos para determinar se um silenciamento de áudio e uma alteração de cena estão presentes, após o que o segmento é dividido. A divisão de segmentos desta forma é diferente da realizada em segmentos longos, em que segmentos novos com um comprimento para além de um valor predeterminado, por exemplo, 60 segundos são divididos em dois numa localização arbitrária mesmo se as marcas de sinalização divididas de alteração de cena e silenciamento de áudio referidas acima não estiverem presentes.
Quando ocorrem números relativamente elevados de desvanecimentos para preto ou quando um desvanecimento para preto é detectado durante um período de tempo relativamente longo, isto normalmente indica que está a ser detectado um sinal com uma qualidade relativamente fraca.
Os desvanecimentos para preto excessivos podem ser o resultado de um sinal fraco ou ruído na entrada. A tentativa de detectar segmentos novos a partir de um sinal de fraca qualidade deste tipo habitualmente resulta na detecção de segmentos residuais. Para corrigir uma situação deste tipo, não são aceites marcas de sinalização provenientes de uma porção de um sinal que é determinado com uma ocorrência deste 78
ΕΡ 1 261 155 /PT tipo relativamente elevada de desvanecimentos para preto. Marcas de sinalização que sejam, assim, não aceites podem não ser utilizadas para uma marca de sinalização de inicio ou fim de segmento novo. A rejeição de marca de sinalização descrita acima é realizada através da utilização de vários factores, por exemplo, uma quantidade de tempo de desvanecimento para preto, o número de transições ligado/desligado ("on/off") de desvanecimento para preto como descrito de seguida e a quantidade de tempo de não-desvanecimento para preto que ocorre durante o ciclo interior descrito anteriormente. Variáveis correspondentes a cada um destes factores são iniciadas após a detecção de uma marca de sinalização de cauda adequada (antes do inicio da exploração do ciclo interior) . De seguida, enquanto o ciclo interior está a explorar para uma marca de sinalização principal, o sinal é monitorizado para detectar os factores acima. Se um possível segmento novo for detectado, o respectivo segmento é examinado para a presença dos factores acima. Se o número de ocorrências destes factores num segmento exceder um valor máximo predeterminado (por exemplo, uma quantidade máxima predeterminada de tempo de desvanecimento para preto e/ou um número máximo predeterminado de transições on/off de desvanecimento para preto), então o segmento não é aceite como um segmento novo.
De acordo com um segundo modo de operação, o módulo de detecção de segmentos novos concretiza o processo ilustrado na Fig. 13 para detecção de segmentos novos de interesse. Num primeiro passo S400, o módulo de detecção de segmentos novos explora as marcas de sinalização e retira todos os intervalos que sejam possibilidades razoáveis para segmentos novos e coloca estes intervalos numa lista de possíveis segmentos para posterior reexame. De seguida, o processamento é atrasado num passo S410 durante um intervalo predeterminado seleccionado para maximizar a possibilidade dos segmentos que se possam sobrepor aos possíveis segmentos já listados serem detectados antes de ser determinado quais dos segmentos em conflito que devem ser aceites e quais descartados. 0 intervalo de atraso pode, por exemplo, ser de, pelo menos, 35 segundos de modo que segmentos de 30 segundos (que ocorrem 79
ΕΡ 1 261 155 /PT com maior frequência) não são perdidos devido a informação insuficiente sobre segmentos que potencialmente se sobrepõem.
Depois do atraso de decisão, o processamento continua num passo S420 em que cada segmento possível é comparado com todos os outros segmentos na lista para determinar se estão presentes conflitos. Em caso afirmativo, uma heurística é aplicada para decidir a que segmento deverá ser atribuída uma prioridade mais elevada com base numa combinação linear de factores relevantes. Estes factores incluem comprimento nominal, marcas de sinalização associadas e desvio do comprimento nominal. Desde que aos segmentos em conflito tenham sido, deste modo, atribuída prioridade, o segmento de prioridade mais elevada é reportado para a base de dados (com a recolha de áudio/vídeo possível para visualização numa estação de trabalho do sítio central) e o segmento de prioridade inferior é marcado como um segmento descartado. No entanto, depois de mais um atraso, representado por um passo S430, os segmentos descartados são reexaminados para determinar se ainda existe um conflito com um segmento aceite. Caso contrário, o segmento anteriormente descartado mas não conflituante é reportado para a base de dados como um segmento de limiar 2 (como explicado aqui abaixo). 0 modo em que a avaliação de conflito no processo de atribuição de prioridade do passo S420 pode resultar na aceitação posterior de um segmento descartado anteriormente é ilustrado pelo seguinte exemplo. Num cenário possível, assume-se que um segmento A se sobrepõe e ocorre depois de um segmento B, enquanto o segmento B se sobrepõe e assume-se que ocorre depois de um segmento C. Assume-se, também, que os segmentos A e C não se sobrepõem. Se o segmento B for comparado primeiro com o segmento A, de modo que ao segmento B é dada prioridade superior a A, então o segmento A será rejeitado. No entanto, o segmento B será comparado com o
segmento C e se o segmento C for preferido então o segmento B também será rejeitado. Uma vez rejeitado o segmento B, o segmento A deixa de estar em conflito, e o mesmo pode, por conseguinte, ser aceite mesmo depois uma rejeição anterior.
De acordo com um terceiro modo de operação do módulo de detecção de segmentos novos, como ilustrado na Fig. 14, num 80
ΕΡ 1 261 155 /PT passo S500 as marcas de sinalização são exploradas para localizar possíveis segmentos que seriam aceitáveis como segmentos novos de interesse de acordo com os critérios descritos acima. Num passo seguinte S510, o processamento é atrasado, por exemplo, durante tanto quanto cinco minutos para garantir que todos os possíveis segmentos relacionados também foram detectados. De seguida, num passo S520 anexo, os segmentos em sobreposição e conflito são colocados em grupos respectivos de segmentos relacionados para processamento adicional, por exemplo, através da marcação de um nó estabelecido para cada um destes segmentos numa fila de dupla extremidade adequada com um número arbitrário que identifica o seu respectivo grupo.
De seguida, uma heurística de dois passos é realizada de forma sequencial nos passos S530 e S540. No passo S530, o módulo de detecção de segmentos novos determina as separações aceitáveis entre os vários segmentos em consideração. Uma separação é uma possível subdivisão ou agrupamento dos segmentos identificados com base em comprimentos nominais aceites para segmentos de interesse. Por exemplo, com referência à Fig. 15, uma árvore de separações para um segmento de 120 segundos com um desvanecimento para preto em cada fronteira de 30 segundos é ilustrada. Na Fig. 15, as possibilidades para separar o segmento de 120 segundos estão organizadas numa estrutura de árvore onde cada ramo a partir da raiz 600 até um nó extremo (por exemplo, nós extremo 602 e 604) representa um percurso respectivo para separar o segmento de 120 segundos. Os números 30, 60, 90 e 120 representam a duração em segundos, ou comprimento de segmento, de um possível segmento formado a partir do segmento principal de 120 segundos. Vê-se que um segmento pode aparecer mais do que uma vez no diagrama.
Uma vez definidos os percursos possíveis de separação do dado segmento de acordo com a árvore de separação, a árvore é atravessada e cada percurso (isto é, possíveis combinações de segmentos) é avaliado de acordo com um conjunto de regras predeterminadas para determinar as separações aceitáveis.
As regras predeterminadas que são empregues na avaliação da aceitabilidade das possíveis separações baseiam-se no 81
ΕΡ 1 261 155 /PT comprimento nominal do segmento principal e dos possíveis sub-segmentos, bem como em limiares de áudio/vídeo (A/V) determinados para esse fim como explicado abaixo em ligação com a determinação do nivel de captura selectiva. No essencial, as regras estão concebidas para evitar separações de limiar A/v, isto é, uma divisão de um segmento de interesse em sub-segmentos com diferentes limiares A/V. As regras são concebidas também para favorecerem separações em comprimentos encontrados com frequência tais como segmentos de 30 segundos. Por exemplo, um segmento de limiar A/V 2 é separado numa pluralidade de sub-segmentos se todos os sub-segmentos possuírem um limiar A/V de 1. Além disso, um segmento de 45 segundos será separado em segmentos encontrados com maior frequência, tais como um segmento de 15 segundos e um segmento de 30 segundos. As várias regras são armazenadas numa tabela que permite modificações futuras.
Se a aplicação das regras anteriores resultar em várias separações aceitáveis, às separações ainda em conflito são atribuídas prioridades de acordo com as seguintes regras adicionais. Primeiro, separações que dão origem à maior duração de segmentos A/V de limiar 1 são favorecidas sobre outras. Se subsistirem então mais do que uma separação, as separações são classificadas numa escala de pontos com base nos comprimentos nominais de cada segmento na separação, de modo que os comprimentos de segmento que ocorrem com maior frequência são favorecidos. Isto é, um valor de pontos por segundo é atribuído para cada comprimento nominal e depois multiplicado pelo comprimento do segmento para acumular um resultado total de pontos para cada comprimento nominal. Por exemplo, se forem atribuídos 3 pontos por segundo a segmentos de 30 segundos, enquanto a segmentos de 15 segundos e de 45 segundos forem atribuídos a cada um 2 e 1 ponto por segundo, respectivamente, o segmento de 45 segundos daria origem a um total de 45 pontos, enquanto que a separação de 30/15 daria origem a um total de 120 pontos, o que deste modo favorece a separação. Consequentemente a escala está construída para favorecer as separações que originam segmentos de comprimentos que ocorrem com mais frequência. Se depois da aplicação das regras anteriores, subsistirem mais do que uma separação, uma é então escolhida arbitrariamente. 82
ΕΡ 1 261 155 /PT
Uma vez concretizada a análise de separação no passo S530, a análise de conflito é concretizada no passo S540 de acordo com a qual é dada prioridade ao segmento mais provável de entre uma pluralidade de segmentos que se sobrepõem no tempo (que são, mutuamente exclusivos). Segmentos que sejam parte de uma separação são agora considerados de forma individual. Cada par de segmentos em conflito é classificado de acordo com uma heurística explicada abaixo e o melhor é escolhido. Por comparação de pares, é escolhido um único segmento de maior preferência. Se depois desta escolha ser concretizada, existirem menos segmentos preferidos que não colidam com esta escolha, os mesmos também são aceites. A heurística é um sistema de classificação que gera uma função linear das propriedades para cada segmento, designadamente, comprimento nominal, marcas de sinalização e desvio do comprimento nominal. Um resultado para cada valor de uma dada propriedade é atribuído com base nos seguintes princípios. Marcas de sinalização de ocorrência são consideradas muito mais fortes do que marcas de sinalização de segmento novo que são por sua vez consideradas como sendo mais fortes do que um único desvanecimento para preto. Em relação ao desvio do comprimento nominal, segmentos são mais prováveis de serem mais curtos do que o comprimento nominal do que mais longos e quanto mais o seu comprimento se desviar do comprimento nominal, menos provável é que tenha sido detectado um segmento de interesse. 0 desvio mais provável está entre 0 e 0,2 segundos. No caso do comprimento nominal, como notado acima, segmentos de 30 segundos são os que se encontram com a maior frequência, seguidos pelos segmentos de 15 segundos, 10 segundos e 60 segundos, por esta ordem, enquanto os segmentos de 20, 45, 90 e 120 segundos consideram-se como sendo muito raros. No global, as marcas de sinalização são ponderadas de forma mais significativa do que as outras duas propriedades. Onde, no entanto, a propriedade de frequência de comprimento nominal é a única consideração, surge um caso especial. Designadamente, se ambos os segmentos em consideração possuírem um limiar de A/V de 1 e um segmento estiver contido no outro, de um modo geral o segmento mais comprido será preferido e um valor de pontos adequado seria então atribuído em função dos comprimentos nominais dos dois segmentos. 83
ΕΡ 1 261 155 /PT Nível de captura selectiva 0 módulo de nível de captura selectiva serve para reduzir o processamento de segmentos residuais nos sítios locais 16 para evitar reportar os mesmos para o sítio central 12 o que iria desperdiçar tempo do operador de estação de trabalho. Um segmento residual é um segmento que foi determinado pelo sistema pericial como sendo um segmento novo de interesse, quando de facto o não é. Por exemplo, um segmento residual pode ser uma breve notícia ou uma porção de programação normal delimitada por marcas de sinalização e com o mesmo comprimento que um segmento de interesse. 0 processamento de segmentos residuais aumenta o tempo de processamento do sistema 10 (Fig. 1) e os seus custos de funcionamento. Isto é, um segmento que é determinado como sendo um segmento novo de interesse, mas que é na realidade um segmento residual, é transmitido do sitio local 16 através do sítio central 12 para uma das estações de trabalho 14 para processamento por um operador, de modo que uma taxa de resíduos elevada aumenta, de forma substancial, o tempo que os operadores têm de despender na tentativa de classificar novos segmentos. Deste modo, tratar segmentos residuais como segmentos novos de interesse aumenta sem vantagem a comunicação entre os sítios locais 16 e o sitio central 12, aumenta a carga de trabalho do operador nas estações de trabalho 14 e aumenta o processamento que tem de ser realizado no sítio local 16. O módulo de nível de captura selectiva divide segmentos determinados como sendo potenciais segmentos novos de interesse em dois grupos, designadamente, segmentos que são mais prováveis de serem segmentos de interesse (não residuais) e segmentos que são menos prováveis de serem segmentos de interesse. Aos segmentos que são mais prováveis de serem segmentos de interesse é atribuído um nível de captura 1 de áudio/vídeo (A/V), enquanto que aos segmentos que são menos prováveis de serem segmentos de interesse é atribuído um nível de captura 2 de áudio/vídeo (A/V). Após a detecção de um possível segmento novo de interesse, se atribuído um nível de captura de A/V de 1 ou 2, é produzida e armazenada uma assinatura de chave respectiva, como explicado 84
ΕΡ 1 261 155 /PT de seguida. Os dados áudio e video (A/V) para um segmento com um nivel de captura 1 de (A/V) são imediatamente recolhidos para transmissão para o sitio central após detecção do segmento novo de interesse. Por outro lado, os dados A/V para um segmento com um nivel de captura 2 de A/V são recolhidos apenas depois da sua assinatura de chave previamente armazenada ter tido, pelo menos, uma coincidência. Isto é, um segmento a que foi atribuído um nível de captura 2 de A/V será difundido e detectado, pelo menos, duas vezes (uma vez para detectar o segmento como um segmento novo e uma vez novamente devido à coincidência da sua assinatura de chave) antes dos dados A/V associados ao mesmo serem recolhidos. Se a sua assinatura de chave não produzir uma coincidência num período de tempo predeterminado, o mesmo é purgado do sistema.
Apenas segmentos com os seus dados A/V recolhidos são introduzidos a partir do respectivo sítio local 16 através do sítio central 12 numa das estações de trabalho 14 (Fig. 1). A maior parte dos segmentos de interesse é emitida mais do que uma vez, enquanto segmentos residuais são vistos apenas uma vez. Consequentemente, através de uma atribuição de um nível de captura de A/V de 2 a segmentos que são menos prováveis de serem segmentos de interesse, de modo que os seus dados A/V não sejam recolhidos até uma coincidência subsequente a estas assinaturas de chave de segmentos, podem ser conseguidas economias substanciais de custos de funcionamento.
De acordo com a técnica para a atribuição de níveis de captura num sistema de reconhecimento de mensagens comerciais televisivas, é atribuído a um segmento novo um nível de captura 2 se o mesmo satisfizer uma das seguintes condições: 1. Se a marca de sinalização única em qualquer extremidade do segmento novo for uma marca de sinalização de silenciamento de áudio. Uma vez que, como explicado anteriormente, silenciamentos de áudio ocorrem frequentemente tanto nas fronteiras do segmento como dentro dos segmentos, segmentos novos com base numa marca de sinalização de silenciamento de áudio virão provavelmente a ser segmentos residuais. 85
ΕΡ 1 261 155 /PT 2. Se ο segmento novo não estiver próximo ou proximal de um grupo ou ficheiro de áudio de mensagens comerciais. Uma vez que a maior parte das mensagens comerciais é emitida em grupos ou ficheiros de áudio, um segmento novo estará provavelmente próximo de um ficheiro de áudio deste tipo. A proximidade a um ficheiro de áudio é avaliada com vantagem pela determinação da proximidade no tempo do segmento novo a outro segmento novo ou a um segmento com uma coincidência aceite. Uma vez que a proximidade de um segmento com uma coincidência aceite para o segmento novo que está a ser avaliado proporciona uma indicação mais fiável de proximidade de ficheiro de áudio do que a proximidade de outro segmento novo ao mesmo, outro segmento novo é considerado proximal apenas se o mesmo entrar num intervalo de proximidade que seja mais estreito do que um intervalo de proximidade estabelecido para segmentos com coincidências aceites. 3. Se o comprimento ou duração nominal do segmento novo for um comprimento de mensagem comercial com ocorrência pouco frequente, por exemplo, comprimentos nominais de 20, 45, 90 ou 120 segundos. Uma vez que mensagens comerciais raramente possuem estes comprimentos, um segmento novo com um comprimento deste tipo é provável que seja um segmento residual. 4. Se o segmento novo se desviar do comprimento nominal de uma quantidade próxima de um limite de desvio de comprimento predeterminado adoptado para determinação da aceitabilidade do segmento como um segmento novo de interesse. Por exemplo, se o limite de desvio de comprimento inferior para uma mensagem comercial de 30 segundos for um segundo tal que segmentos com durações inferiores a 29 segundos são considerados como não sendo segmentos novos de interesse, a um segmento com uma duração de aproximadamente 29,1 segundos será dado um nivel de captura de A/V de 2. Quanto mais se desviar um segmento novo do comprimento nominal, maior probabilidade terá de ser um segmento residual. 86
ΕΡ 1 261 155 /PT
Por outro lado, a um potencial segmento novo é atribuído um nível de captura 1 se ao mesmo não for atribuído um nível de captura 2. É apreciado que as condições 1, 3 e 4 sejam facilmente verificadas na altura em que um novo segmento de interesse é encontrado. No entanto, a verificação de que um segmento novo é proximal de um ficheiro de áudio de acordo com a condição 2 necessita de uma avaliação de sinais recebidos de seguida para coincidências e outros segmentos novos. Por conseguinte, como um exemplo, se o segmento novo que está a ser avaliado for o primeiro segmento num ficheiro de áudio, não é conhecido imediatamente que o segmento novo é proximal do ficheiro de áudio. De acordo com uma concretização vantajosa, aos segmentos novos que satisfaçam todas as condições para o nível de captura 1 excepto a condição 2 é inicialmente
atribuído o nível de captura 1 de A/V para que os dados A/V correspondentes sejam armazenados na base de dados para permitirem posterior transmissão para o sítio de controlo.
Esta determinação é revista novamente depois de um tempo predeterminado, por exemplo, vários minutos, em cujo tempo se o segmento ainda não tiver sido determinado como sendo proximal de um ficheiro de áudio, o nível de captura de A/V deste segmento é alterado para o nível de captura 2. Este procedimento permite a retenção dos dados A/V do segmento em função de uma avaliação completa de toda a informação necessária para determinar quando se obtém a condição 2. Se esta avaliação atrasada então estabeleceu que ao segmento deveria ser atribuído o nível de captura 1 de A/V, os dados A/V do mesmo estão ainda disponíveis para transmissão para o sítio central. Caso contrário, o mesmo é anulado da base de dados. A utilização da técnica de nível de captura selectiva descrita acima permite que o sistema pericial alivie os seus critérios para determinar que segmentos são prováveis de serem segmentos de interesse enquanto se mantém uma carga de processamento aceitável no sistema 10 (Fig. 1).
Consequentemente, o sistema pericial pode, deste modo, empregar critérios de segmento novo que permitam a aceitação de relativamente mais segmentos como segmentos novos de interesse, por exemplo, através da adopção de tolerâncias de 87
ΕΡ 1 261 155 /PT comprimento relativamente mais amplas. Consequentemente, quaisquer segmentos novos de interesse que satisfaçam apenas os critérios aliviados podem ser detectados onde os mesmos, caso contrário, faltariam. Em consequência, a precisão de coincidência do sistema global pode ser aumentada. A Fig. 16 ilustra o fluxo de sinal para capturar dados áudio e vídeo. Como mostrado aqui, sinais áudio e vídeo de banda base são introduzidos das cartas de canal 402 do subsistema de reconhecimento de segmentos pelos cabos 431 e 439, respectivamente, no subsistema de captura de dados 28. O subsistema de captura de dados 28 inclui uma carta de captura de vídeo 432, uma memória temporária em anel de vídeo comprimido 430, um controlador de captura de dados 434, uma memória temporária em anel de áudio comprimido 436 e uma carta de captura de áudio 438. O sinal de vídeo de banda base recebido do cabo 431 é introduzido na carta de captura de vídeo 432, a qual proporciona em contínuo os sinais de vídeo recebidos recentemente em forma comprimida para a memória temporária em anel de vídeo comprimido 430 que mantém um registo actual dos sinais de vídeo comprimidos recebidos mais recentemente, por exemplo, os recebidos durante os últimos 3 a 7 minutos. De modo semelhante, os sinais áudio banda base do cabo 439 são introduzidos na carta de captura de áudio 438, a qual proporciona em contínuo os sinais áudio recentemente recebidos em forma comprimida para a memória temporária em anel de áudio comprimido 436 que, do mesmo modo, mantém um registo actual dos mesmos.
O subsistema de captura de dados 28 comunica com o computador de controlo 30 o qual, por sua vez, utiliza o sistema pericial 414, o controlo da base de dados 416, a base de dados 412, um controlo de recolha de A/V 440 e um disco 442. Como um exemplo, se uma mensagem comercial nova tiver sido detectada com um valor de captura ou limiar de 1, o sistema pericial 414 fornece um sinal de modo a indicar isso ao controlo da base de dados 416. Após a recepção de um sinal deste tipo, o controlo da base de dados 416 proporciona um sinal de comando a solicitar que os respectivos dados áudio e vídeo sejam transferidos para o controlo de recolha de A/V 440, o qual, por sua vez, proporciona um sinal de solicitação correspondente ao controlador de captura de dados 434. Após a 88 ΕΡ 1 261 155 /PT recepção de um sinal deste tipo, o controlador de captura de dados 434 proporciona os respectivos sinais de controlo para a memória temporária em anel de vídeo 430 e para a memória temporária em anel de áudio 436, após o que os sinais de áudio e vídeo solicitados são introduzidos no controlador de captura de dados 434. Os sinais de áudio e vídeo solicitados são de seguida introduzidos do controlador de captura de dados 434 no controlo de recolha de A/V 440 o qual, por sua vez, fornece os mesmos ao disco 442 para armazenamento. Além disso, o controlo de recolha de A/V 440 fornece o número de identificação do segmento em conjunto com um sinal que indica se os dados áudio e vídeo foram recolhidos para o respectivo segmento para a base de dados 412. Além disso, em certas situações como descrito anteriormente, o sistema pericial 414 pode fornecer um sinal de anulação ao controlo da base de dados 416. Este sinal é de seguida introduzido no controlo de A/V 440 após o que o ficheiro adequado de dados A/V é apagado. Nestas situações, o controlo de A/V 440 fornece um sinal de confirmação ao controlo da base de dados 416 que confirma a anulação destes ficheiros.
GERAÇÃO DE ASSINATURA DE CHAVE
Após a detecção de um novo segmento de interesse, como notado acima, o sistema 10 produz uma assinatura de chave para o segmento que é utilizada por último para reconhecer uma redifusão do mesmo segmento para comparação ou coincidência com a palavra-chave e as oito palavras de coincidência da assinatura de chave com assinaturas de quadro correspondentes de uma assinatura de segmento produzida para o segmento redifundido. Com referência à Fig. 17, o computador de controlo 30 implementa um módulo gerador de assinaturas de chave 410 que recebe assinaturas de quadro em sequência para o segmento de interesse, referida como uma assinatura de segmento, para produzir uma assinatura de chave a partir da mesma. Esta assinatura de chave é de seguida introduzida no subsistema de reconhecimento de segmentos 26 para utilização nas operações de coincidência subsequentes. É apreciado que um número relativamente grande de segmentos de interesse (por exemplo, mensagens comerciais) será recebido em cada um dos sítios locais 16 (Fig. 2) e é 89
ΕΡ 1 261 155 /PT desejável que cada uma destas assinaturas de chave possua uma dimensão relativamente pequena para minimizar a quantidade de memória necessária. É também desejável que as assinaturas de chave correspondam facilmente após uma redifusão do respectivo segmento, enquanto se evita falsa coincidência. Consequentemente, o módulo gerador de assinaturas de chave 410 produz assinaturas de chave que são, com vantagem, pequenas na dimensão e que são seleccionadas e estruturadas para maximizar a probabilidade para uma coincidência numa redifusão do respectivo segmento, enquanto reduz o potencial para falsa coincidência.
Uma assinatura de segmento para geração de assinaturas de chave é recebida para processamento pelo módulo 410 na forma de assinaturas de quadro de video e áudio combinadas. O módulo 410 então separa a assinatura de segmento recebida em assinaturas de segmentos de video e de áudio o qual processa as mesmas em separado. Por exemplo, o módulo de geração de assinaturas de chave pode realizar dois ciclos de processamento separados, isto é, um para a assinatura do segmento de video e uma para a assinatura do segmento de áudio. Em consequência, tipicamente, pelo menos, uma assinatura de chave de áudio (ou sub-assinatura) e uma assinatura de chave de vídeo (ou sub-assinatura) é produzida para cada assinatura de segmento, possuindo cada uma o mesmo formato de dados.
Cada assinatura de chave inclui, de preferência, 16 elementos que serão agora descritos em detalhe. 1. Número de identificação de segmento (ID Segmento) -este número de identificação identifica de forma única o segmento identificado pela assinatura de chave e, por exemplo, num sistema de reconhecimento de mensagens comerciais televisivas pode ser utilizado para associar de forma mais fácil mensagens comerciais com as suas respectivas assinaturas de chave. Como descrito aqui abaixo, o módulo 410 sob certas circunstâncias gera até quatro assinaturas de chave de vídeo e quatro assinaturas de chave de áudio para um dado segmento. Consequentemente, o ID do segmento é composto de um número divisível por cinco em conjunto com um número de 90
ΕΡ 1 261 155 /PT 1 a 4 ο que indica o número de assinaturas de chave de áudio e de vídeo produzido para o segmento. 2. Palavra-chave - uma palavra-chave de 16 bits é seleccionada para cada segmento de entre as assinaturas de quadro do mesmo que compreendem a sua assinatura de segmento. Como descrito acima, as palavras-chave são utilizadas pelo subsistema de reconhecimento de segmentos 26 como um índice para a base de dados de assinaturas de chave para minimizar o tempo necessário na detecção de uma coincidência. 3. Afastamento de palavra-chave - representa a distância do início do respectivo segmento para a palavra-chave. Este afastamento pode ser expresso, por exemplo, como o número de quadros do início do segmento ou em termos do tempo do início deste segmento. 4. Palavras de coincidência - existe uma pluralidade de palavras de coincidência de 16 bits (por exemplo, 8) em cada assinatura de chave. As palavras de coincidência de uma dada assinatura de chave são utilizadas pelo subsistema de reconhecimento de segmentos 26 durante a operação de coincidência depois da palavra-chave associada ter coincidência com um quadro que chega. Isto é, como descrito anteriormente, cada assinatura de quadro recebida é comparada com todas as palavras-chave armazenadas. Após a detecção de uma coincidência entre uma assinatura de quadro que chega e uma palavra-chave (por exemplo, com base numa coincidência de, pelo menos, quinze valores de bit correspondentes da assinatura de quadro e da palavra-chave), todas as palavras de coincidência associadas com esta palavra-chave são então comparadas com os quadros adequados que chegam como determinado pelos afastamentos de palavra de coincidência, descritos abaixo. Se o número total de bits não dissimulados que não correspondem no valor combinado com uma metade do número de bits das assinaturas de quadro comparados que forem dissimulados, não exceder uma contagem de erro ou limiar predeterminado (descrito abaixo), então uma coincidência é determinada. Critérios para seleccionar a palavra- 91
ΕΡ 1 261 155 /PT chave e as palavras de coincidência para as assinaturas de chave são descritos de seguida. 5. Afastamento de palavra de coincidência - existe um afastamento de uma palavra de coincidência para cada uma das palavras de coincidência. Cada afastamento de palavra de coincidência indica a posição da respectiva palavra de coincidência relativa à sua palavra-chave. Como com os afastamentos de palavra-chave descritos acima, os afastamentos de palavra de coincidência podem ser expressos em termos de diferenças de tempo ou de números de quadros. Estes afastamentos de palavra de coincidência são utilizados para indicar qual das assinaturas de quadro que chegam do segmento de difusão se destina a ser utilizada para comparação com as palavras de coincidência na assinatura de chave quando uma coincidência de palavra-chave foi detectada. 6. Tipo de assinatura - o tipo de assinatura identifica se a assinatura é uma sub-assinatura áudio ou uma sub-assinatura video. Uma vez que as sub-assinaturas de chave de video e de áudio possuem o mesmo formato, este elemento é utilizado para distinguir as mesmas. 7. Contagem de erro - a contagem de erro ou limiar de erro é gerada pelo módulo de geração de assinaturas de chave para cada assinatura de chave gerada e indica o número máximo de erros que pode ser permitido durante o processo de coincidência antes da coincidência que está a ser considerada ser rejeitada como inaceitável. A contagem de erro pode ser baseada em caracteristicas especificas da assinatura de chave gerada, por exemplo, a dependência esperada do segmento correspondente e a probabilidade da coincidência falsa de assinatura de chave. Uma técnica vantajosa para determinar a contagem de erro utiliza o número provável de coincidências de bits para as palavras de coincidência, como descrito abaixo, arredondando para baixo este número e subtraindo o número resultante do número total de coincidências possíveis. A contagem de erro resultante é tornada inferior no caso de segmentos mais curtos que são mais prováveis a coincidência falsa. É apreciado que, sob 92
ΕΡ 1 261 155 /PT certas condições (por exemplo, devido a ruído), a assinatura de chave pode não corresponder de forma perfeita a uma redifusão do segmento correspondente. A contagem de erro compensa estas discrepâncias antecipadas para permitir a detecção do segmento redifundido. 8. Contagem de quadro - a contagem de quadro indica o número de quadros contidos com a assinatura de chave que, na concretização preferida, possui um valor de 8. 9. Comprimento - refere-se ao número de quadros no respectivo segmento. 10. Regras de coincidência - regras de coincidência são geradas pelo módulo gerador de assinaturas de chave para cada segmento representado por uma ou mais assinaturas de chave na base de dados e são linhas guia utilizadas pelo subsistema pericial 414 na determinação de aceitar ou não uma coincidência das assinaturas de chave para este segmento. Se existir uma probabilidade relativamente elevada de falsa coincidência tanto da sub-assinatura de chave de áudio como de vídeo, as regras de coincidência necessitam que tanto a sub-assinatura de chave de áudio como de vídeo correspondam a fim de uma coincidência ser aceite. Se, por outro lado, for determinado que nem a sub-assinatura de chave de áudio nem a de vídeo forem de provável falsa coincidência e, de facto, poderem ter dificuldade na coincidência, as regras de coincidência aceitam uma coincidência se quer a sub-assinatura de chave de áudio quer a de vídeo corresponderem.
As regras de coincidência baseiam-se na probabilidade das sub-assinaturas corresponderem de forma correcta com uma redifusão do segmento correspondente, bem como as probabilidades de falsa coincidência das sub-assinaturas. O modo em que a probabilidade de uma coincidência correcta é avaliada é explicado aqui abaixo. A probabilidade de falsa coincidência ou quociente de coincidência falsa é determinada como a média de um primeiro valor inversamente proporcional à quantidade de informação numa assinatura (isto é, quanto 93
ΕΡ 1 261 155 /PT maior o número de bits que forem iguais, mais elevado fica o primeiro valor) e um segundo valor que é um valor de agrupamento normalizado para a assinatura. 0 valor de agrupamento normalizado é obtido pela multiplicação do número de assinaturas de chave na base de dados com a mesma palavra-chave que a assinatura em consideração, pela probabilidade a priori que uma assinatura de quadro (ou qualquer permuta única de bit da mesma) correspondente com a palavra-chave seja produzida. 0 valor de agrupamento normalizado representa a tendência de assinaturas de chave serem concentradas (ou agrupadas) sob uma dada palavra-chave. 11. Número de conjuntos de bits máscara - este número representa a soma total de todos os bits máscara que são activados para a palavra-chave e todos das palavras de coincidência associadas. 12. Quociente de coincidência falsa - representa a probabilidade da respectiva assinatura de chave proporcionar uma coincidência falsa quando comparada com uma assinatura de segmento e é determinado na forma explicada acima em ligação com as regras de coincidência. 13. Nitidez - muitas vezes existem múltiplos quadros consecutivos num segmento que são substancialmente idênticos, por exemplo, a quadros de sinal de video que correspondem a uma única cena. Estes grupos de quadros consecutivos substancialmente idênticos são designados passagens. Nitidez representa a taxa de alteração nos bits das assinaturas de quadro nas extremidades das passagens dos quais foi derivada a assinatura de chave e é utilizada para delinear as margens das passagens. 14. Probabilidade de coincidência da outra sub-assinatura de chave correspondente - como referido anteriormente, a assinatura de chave pode ser dividida em duas sub-assinaturas, isto é, uma para áudio e uma para video. A probabilidade de coincidência referida aqui é a probabilidade que outra sub-assinatura correspondente corresponda ao respectivo segmento. Por 94
ΕΡ 1 261 155 /PT exemplo, considere-se a situação em que o subsistema de reconhecimento de segmentos 26 detecta uma coincidência áudio, mas não uma coincidência video, para um segmento particular. Esta informação de coincidência é de seguida introduzida no sistema pericial após o que, se a sub-assinatura de chave áudio indicar que existe uma probabilidade relativamente elevada de coincidência para a outra sub-assinatura (isto é, a sub-assinatura de video) corresponder, o sistema pericial provavelmente não aceita a mesma como uma coincidência, uma vez que a sub-assinatura de chave video deveria também ter correspondido. A probabilidade de coincidência é determinada no curso da selecção de palavra-chave e palavra de coincidência, como descrito abaixo. 15. Número de sub-assinaturas - este número representa o número de sub-assinaturas que o módulo de geração de assinaturas de chave gerou para um respectivo segmento. Em certas situações, como referido anteriormente, o módulo de geração de assinaturas de chave pode gerar múltiplas assinaturas (ou sub-assinaturas) para um segmento particular se isso aumentar a probabilidade de obtenção de mais coincidências aceitáveis. Por exemplo, se a primeira sub-assinatura de chave produzida possuir uma baixa probabilidade de coincidência falsa, bem como uma baixa probabilidade de uma coincidência verdadeira, o módulo 410 pode gerar também sub-assinaturas para o segmento para aumentar a probabilidade de uma coincidência verdadeira. Em caso afirmativo, na geração de cada sub-assinatura adicional o módulo 410 exclui assinaturas de quadro de passagens utilizadas anteriormente para gerar sub-assinaturas de chave. No entanto, se a probabilidade de coincidência falsa da primeira sub-assinatura de chave for comparativamente elevada, não são geradas sub-assinaturas adicionais na medida em que isso aumentaria as possibilidades para uma coincidência falsa. Além disso, se o módulo 410 determina que a probabilidade de coincidência falsa para uma sub-assinatura de vídeo é muito elevada, o mesmo pode escolher não gerar quaisquer sub-assinaturas de vídeo. Numa concretização preferida, o módulo de geração 95
ΕΡ 1 261 155 /PT de assinaturas de chave pode gerar até quatro sub-assinaturas de chave de áudio e video. 16. Largura de pico esperada - tipicamente, tanto as palavras-chave como as palavras de coincidência são seleccionadas da parte central das passagens de assinatura de quadro. Consequentemente, o subsistema de reconhecimento de segmentos 26 pode detectar múltiplas coincidências numa dada assinatura de chave para quadros consecutivos. 0 número destas coincidências detectadas consecutivamente é referido como a largura de pico. 0 módulo de geração de assinaturas de chave examina a estrutura da passagem na assinatura de segmento e gera um valor de largura de pico antecipado para a mesma.
Como descrito anteriormente, cada quadro de um segmento que chega possui uma assinatura de quadro associada ao mesmo. 0 módulo de geração de assinaturas de chave examina cada uma destas assinaturas de quadro para seleccionar uma palavra-chave e oito palavras de coincidência aceitáveis para uma assinatura de chave respectiva. Ao realizar uma selecção deste tipo, o módulo gerador de assinaturas de chave 410 emprega os seguintes critérios: 1. Distribuição das assinaturas de quadro seleccionadas - as palavras de coincidência deverão ser seleccionadas de entre assinaturas de quadro que estejam distribuídas de forma uniforme ao longo da assinatura de segmento. Esta selecção reduz a probabilidade de falsa coincidência. Por exemplo, se duas ou mais mensagens comerciais possuírem cenas semelhantes, a selecção de palavras de coincidência de entre as assinaturas de quadro distribuídas de forma uniforme tende a obrigar, pelo menos, várias das palavras de coincidência a serem seleccionadas das assinaturas de quadro que fiquem no exterior das cenas semelhantes. A distribuição das palavras de coincidência é quantificada como uma separação normalizada no tempo ou em intervalos de quadro entre as mesmas. No entanto, assinaturas de quadros próximas das extremidades do segmento deverão ser evitadas para garantir que os passagens de onde as mesmas são seleccionadas estão contidas no respectivo 96
ΕΡ 1 261 155 /PT segmento, bem como para evitar a utilização de sinais que estão mais predispostos a variações no nivel de sinal (por exemplo, devido a atrasos inerentes no controlo automático de ganho). Para além disso, as palavras-chave são, de preferência, seleccionadas de quadros próximos do inicio do segmento, a fim de maximizar o tempo disponível para o sistema pericial avaliar uma coincidência na assinatura de chave correspondente. Tanto as palavras-chave como as palavras de coincidência deverão ser seleccionadas de assinaturas no ou próximo dos centros de passagens; esta consideração é implementada pelo critério de probabilidade de coincidência na forma descrita abaixo. 2. A probabilidade de um valor particular de assinatura de quadro ser gerado - as assinaturas de quadro geradas pelo sub-sistema de reconhecimento de segmentos 26 podem não ser distribuídas de forma uniforme de entre todos os valores de assinaturas de quadro possíveis, mas pelo contrário podem ser agrupadas com outras assinaturas de quadro semelhantes. Isto corresponde com a distribuição a priori de assinaturas de quadro explicada acima em ligação com as regras de coincidência e é determinado pela captura estatística de grandes números de assinaturas de quadro e pela determinação da sua distribuição global para determinar uma probabilidade normalizada de geração para cada assinatura de quadro potencial. 0 agrupamento de assinaturas de quadro pode provocar a ocorrência de falsa coincidência e aumentar de forma significativa a carga de processamento do dispositivo de correlação. Em consequência, na selecção de assinaturas de quadro, o módulo de geração de assinaturas de chave favorece assinaturas de quadro que não sejam agrupadas deste modo quando comparadas com uma assinatura de quadro agrupada, minimizando, deste modo, o número de assinaturas de chave que possuem palavras de coincidência com valores semelhantes. 3. A distribuição de palavras-chave estabelecida previamente - o módulo gerador de assinaturas de chave 410 considera a distribuição de palavras-chave que foram geradas previamente e armazenadas numa base de dados do 97
ΕΡ 1 261 155 /PT subsistema de reconhecimento de segmentos 26. Como um exemplo, para uma palavra-chave particular, o módulo de geração de assinaturas de chave considera o número de assinaturas de chave geradas que estão associadas com esta palavra-chave. Se uma palavra-chave destas já estiver associada com um grande número de assinaturas de chave, esta palavra-chave é menos provável de ser seleccionada quando comparada com uma palavra-chave associada com um número inferior de assinaturas de chave. Deste modo, este factor, como o factor 2 acima é utilizado para minimizar agrupamento para reduzir o número de coincidências falsas que ocorrem e reduzir a carga de processamento do dispositivo de correlação. No entanto, ao contrário do factor 2 acima, este factor depende dos sinais de difusão. Por exemplo, se forem recebidas várias mensagens comerciais com conteúdo de dados semelhante, então várias assinaturas de chave podem ser geradas com palavras-chave idênticas. Isto não se deve ao subsistema de reconhecimento de segmentos 26, ao contrário do factor 2 acima, mas é uma função dos dados de difusão e é determinado como uma frequência de ocorrência normalizada. Os factores 2 e 3 são multiplicados para darem origem a um único factor que indica o carácter não desejável de uma dada palavra-chave devido a agrupamento. 4. Comprimento de passagem - foi observado que passagens relativamente pequenas, por exemplo, as que possuem comprimentos inferiores a aproximadamente cinco quadros, são menos prováveis de coincidência quando comparadas com passagens mais longas. Além disso, foi também observado que a probabilidade de possuírem uma coincidência aceitável não aumenta de forma significativa para passagens relativamente longas, por exemplo, aquelas com um comprimento maior do que aproximadamente dez quadros. No entanto, estas passagens relativamente longas podem produzir assinaturas de chave com uma entropia relativamente baixa. Deste modo, é desejável utilizar comprimentos de passagem que não sejam nem relativamente pequenos nem relativamente grandes. No ambiente preferido, o módulo de geração de assinaturas de chave utiliza passagens que possuem um 98
ΕΡ 1 261 155 /PT comprimento de aproximadamente cinco a dez quadros. Consequentemente, uma figura normalizada de mérito é atribuída a cada comprimento de passagem com base nos critérios anteriores. 5. Probabilidade de coincidência - uma vez definidas passagens de comprimento aceitável, o módulo gerador de assinaturas de chave 410 avalia a probabilidade de cada uma das assinaturas de quadro corresponder com sucesso durante uma redifusão do segmento correspondente de acordo com o processo de coincidência de palavra-chave. De forma mais específica, a palavra-chave é seleccionada como a assinatura de quadro num afastamento n do segmento mais provável de corresponder após a redifusão do segmento numa banda de guarda predeterminada de ±g assinaturas de quadro. Se a probabilidade de uma coincidência com uma assinatura de quadro com afastamento m de acordo com o procedimento de coincidência de palavra-chave (isto é, uma coincidência de todos os 16 bits ou de, pelo menos, 15 dos 16 bits) é designada pk(m, n), então a probabilidade pk(m, n) pode ser determinada como se segue: pk(m, n) = 15*pm + S[PH/P(i)], i = 0 a 15 onde PM é a probabilidade de uma coincidência em todos os bits determinada como se segue: PM = produto [P (i)], i = 0 a 15, e P(i) é a probabilidade de uma coincidência de (i) bits das palavra-chave e assinatura de quadro potenciais, onde i = 0 a 15. É apreciado que P(i) é determinada com base nos respectivos bits máscara da palavra-chave e da assinatura de quadro potenciais que estão a ser comparadas. É também apreciado que a probabilidade de uma palavra-chave potencial em afastamento n corresponder com uma ou mais assinaturas de quadro ao longo de um dado intervalo de um afastamento a para um afastamento b, designada pk(a:b, n) pode ser derivada da relação: pk(a:a+l, n) = pk(a, n) + pk(a+l, n) - [pfc(a, n) * pk(a+l, n)].
Por indução, vê-se que: 99
ΕΡ 1 261 155 /PT pk(a:b, η) = pk(a:b-i, η) + pk(b, η) - [pk(a:b-l, η) * pk(b, η)], o que facilmente permite que uma determinação da probabilidade de uma dada palavra-chave potencial em afastamento n corresponda com, pelo menos, uma assinatura de quadro no intervalo ±g, designada pk(n-g: n+g, n) . Uma técnica vantajosa para determinar a banda de guarda ±g calcula que pk(n-g: n+g, n) para valores de g que aumentam desde zero até pk(n-g, n) ou pk(n+g, n) está abaixo de um limiar predeterminado, o que garante que palavras-chave potenciais próximas dos centros de passagens sejam atribuídas, com vantagem, a probabilidades mais elevadas do que as mais próximas às extremidades das passagens. Através da determinação destas probabilidades respectivas para todas as palavras-chave potenciais entre as passagens aceitáveis da assinatura de segmento, a cada palavra-chave potencial é atribuída uma figura de mérito com base na probabilidade de coincidência determinada na forma anterior.
As figuras relativas de mérito são também atribuídas a palavras de coincidência potenciais que podem ser seleccionadas das assinaturas de quadro das passagens aceitáveis. A figura de mérito é determinada de acordo com o modo como as palavras de coincidência são utilizadas no processo de coincidência, designadamente, o número de bits de cada palavra de coincidência potencial em afastamento n que são esperados corresponder com as assinaturas de quadro em afastamentos m respectivos na passagem correspondente é determinado e então calculada a média ao longo da passagem para derivar um número médio de bits esperado corresponder ao longo da passagem como a figura de mérito. 0 número de bits esperado corresponder entre uma palavra de coincidência potencial em afastamento n e uma assinatura de quadro em afastamento m, designado bm(m, n), é determinado como se segue: bm(m, n) = S[P(i)], i = 0 a 15 onde P(i) é a probabilidade de uma coincidência de (i) bits, obtida da mesma maneira do que no caso da determinação da probabilidade de coincidência da 100
ΕΡ 1 261 155 /PT palavra-chave. Então a média do número de bits que se espera que correspondam, bm(m, n), é determinada ao longo de um comprimento de passagem desde o afastamento a até ao afastamento b como se segue: bm(a: b, n) - 2[bm(m,n )]/(b-a+l), m = a a b
As fronteiras a e b da passagem são determinadas da mesma forma do que na determinação da probabilidade de coincidência da palavra-chave. 6. Entropia - o módulo de geração de assinaturas de chave prefere palavras de coincidência a partir da assinatura de segmento que possuam uma entropia relativamente elevada, isto é, palavras de coincidência que possuam cada uma um respectivo conteúdo de dados que é diferente daquele das outras palavras de coincidência seleccionadas. A selecção de palavras de coincidência de elevada entropia minimiza a correlação entre palavras de coincidência e, consequentemente reduz a probabilidade de falsa coincidência. Uma dissimilitude normalizada no conteúdo de dados entre palavras de coincidência pode ser determinada pela contagem do número de bits que sejam diferentes entre as palavras de coincidência. 7. Nitidez da passagem - o módulo de geração de assinaturas de chave, de preferência, selecciona uma palavra-chave e as oito palavras de coincidência das passagens de quadro que sejam delimitadas por assinaturas de quadro com valores de assinatura que sejam, de forma substancial, diferentes dos quadros adjacentes na passagem. A diferença nos valores de bit entre a assinatura de quadro fronteira e as assinaturas adjacentes na passagem é utilizada para derivar uma figura normalizada de mérito para nitidez da passagem. É apreciado que pode não ser sempre possível optimizar cada um dos sete factores acima durante a selecção de uma palavra-chave e/ou palavras de coincidência.
Consequentemente, para cada palavra-chave e/ou palavra de coincidência em consideração, o módulo de geração de assinaturas de chave atribui um valor de mérito normalizado para cada um dos sete factores descritos acima como descrito acima. Para selecção de palavra-chave, os factores de 101
ΕΡ 1 261 155 /PT ponderação da palavra-chave respectiva são obtidos a partir de um ficheiro de parâmetros e são multiplicados pelos correspondentes valores de mérito normalizados. Os produtos são então somados para resultarem no valor de mérito global para cada palavra-chave possível. Para selecção de palavra de coincidência é empregue o mesmo processo de ponderação e combinação dos factores de mérito normalizados, utilizando diferentes factores de ponderação respectivos do ficheiro de parâmetros.
Os ficheiros de parâmetros são derivados de forma empírica. De acordo com uma técnica para o realizar, todos os factores de ponderação são inicialmente ajustados para o mesmo valor e são então geradas assinaturas de chave para avaliar a importância relativa de cada critério na geração de assinatura de chave. Este processo é repetido até que por acumulação e avaliação dos resultados, os factores de ponderação mais vantajosos sejam verificados. São mantidos diferentes ficheiros de parâmetros para assinaturas de vídeo e áudio no reconhecimento das suas características diferentes. Os ficheiros de parâmetros também incluem valores de admissibilidade máxima para limiares de erro como uma função do comprimento de segmento, como foi observado segmentos relativamente pequenos, por exemplo, aqueles mais curtos do que aproximadamente 10 segundos, são mais prováveis de coincidência falsa do que segmentos relativamente mais compridos, por exemplo, os de 30 segundos ou mais.
Os passos básicos utilizados pelo módulo de geração de assinaturas de chave estão ilustrados na Fig. 18. Como mostrado aqui, assinaturas de quadro de passagens definidas que estão em consideração para utilização como palavras-chave e palavras de coincidência são obtidas como mostrado nos passos S200 e S210, respectivamente. De seguida, em S220, a palavra-chave e as palavras de coincidência mais aceitáveis são seleccionadas por comparação com os valores totais de mérito para cada candidato a palavra-chave e palavra de coincidência, como descrito acima em conjunto com critérios absolutos tais como observância de limiares de erro de admissibilidade máxima. Das palavra-chave e palavras de coincidência seleccionadas, é criada uma assinatura de chave correspondente como indicado no passo S230. De seguida, no 102
ΕΡ 1 261 155 /PT passo S240, é realizada uma determinação se mais assinaturas de chave tiverem de ser produzidas para aumentar a probabilidade de coincidência. Se a determinação no passo S240 for afirmativa, são produzidas assinaturas de chave adicionais através da repetição dos passos S200-S230, utilizando diferentes passagens, no entanto. Se, por outro lado, não forem necessárias assinaturas de chave adicionais, como indicado por um NÃO no passo S240, então as regras de coincidência para a assinatura de chave gerada no passo S230 são formuladas e combinadas com a assinatura de chave, como indicado no passo S250.
Referindo novamente a Fig. 17, são ai ilustrados fluxos de dados de sinal típicos na geração de uma assinatura de chave. O fluxo de dados de sinal é principalmente entre o subsistema de reconhecimento de segmentos 26 e o computador de controlo 30. De forma mais específica, um sinal de difusão desejado é recebido por um dos conversores 24 respectivos, que está sintonizado para o canal desejado. Sinais áudio e vídeo de banda base são introduzidos a partir do sintonizador 24 numa das cartas de canal 402 correspondentes do subsistema de reconhecimento de segmentos 26 que está concebido para gerar assinaturas de quadro e correspondentes palavras máscara para cada quadro dos sinais de banda base recebidos. Estas assinaturas de quadro e palavras máscara são introduzidas no controlador de reconhecimento de segmentos 404 do subsistema de reconhecimento de segmentos 26.
Antes de poder ser determinado que um novo segmento de interesse foi recebido de modo que uma assinatura de chave tem de ser produzida, o controlador de reconhecimento de segmentos 404 tenta fazer corresponder as assinaturas de quadro recebidas com assinaturas de chave existentes, como descrito anteriormente. O controlador de reconhecimento de segmentos 404 fornece marcas de sinalização (que incluem relatórios de coincidência) ao módulo de sistema pericial 414 contido no computador de controlo 30 que o sistema pericial utiliza para detectar segmentos novos de interesse. De seguida, o sistema pericial 414 fornece um sinal de pedido ao controlador de reconhecimento de segmentos 404 para a assinatura de segmento do segmento que não correspondeu e que pode ser um novo segmento de interesse. Em resposta ao mesmo, 103 ΕΡ 1 261 155 /PT ο controlador de reconhecimento de segmentos 404 recupera a respectiva assinatura de segmento de uma memória temporária em anel de assinaturas de segmento 406 e fornece a mesma ao módulo de sistema pericial. Se o sistema pericial 414 determinar que o respectivo segmento é um segmento de interesse, o sistema pericial fornece um sinal, que inclui toda a informação necessária que pertença ao mesmo (por exemplo, a assinatura de segmento, um número de identificação, o canal e a altura do dia), através do módulo de controlo da base de dados 416 a um gerador de assinaturas de chave 410 implementado pelo computador de controlo 30. O gerador de assinaturas de chave 410 gera uma nova assinatura de chave para o segmento recebido de uma forma como descrito anteriormente e fornece a nova assinatura de chave através do módulo de controlo da base de dados 416 ao controlador de reconhecimento de segmentos 404 o qual, por sua vez, fornece a mesma a uma base de dados de assinaturas de chave 408. Além disso, informação relativa ao novo segmento de interesse é introduzida a partir do módulo de controlo da base de dados 416 na base de dados 412. O termo "probabilidade" como utilizado ao longo deste fasciculo refere-se tanto à probabilidade relativa ou frequência de ocorrência de um evento ou eventos como à probabilidade absoluta de ocorrer um evento ou eventos, e pode ser expressa quer como um valor normalizado quer pelo contrário, por exemplo, como uma expressão não quantificada da probabilidade relativa de dois ou mais eventos. O termo "difusão" como utilizado aqui refere-se a vários modos para a ampla disseminação de informação, tais como emissões de rádio e televisão, se distribuídas via rádio, por cabo, CATV, satélite ou de qualquer outro modo, bem como outros modos para a ampla disseminação de dados e informação. É apreciado que, enquanto intervalos de quadro de vídeo ou de campo são utilizados na concretização apresentada para a geração de assinaturas bem como para outras finalidades em ligação com um sistema de reconhecimento de mensagens comerciais televisivas, a utilização de intervalos de quadro ou campo é utilizada meramente para conveniência e é entendido que intervalos diferentes podem ser seleccionados para geração de assinaturas e outras finalidades deste tipo. 104
ΕΡ 1 261 155 /PT
Como um exemplo, podem ser produzidas assinaturas a partir de uma combinação de campos ou quadros a partir de subconjuntos de informação de quadros ou campos nos sinais de video, e que intervalos de áudio não necessitam de corresponder com intervalos de video, mas podem ser escolhidos arbitrariamente. De acordo com um sistema para reconhecimento de segmentos de difusão rádio, qualquer intervalo arbitrário pode ser utilizado para geração de assinaturas e outras finalidades, desde que informação suficiente esteja incluida no intervalo seleccionado.
Enquanto uma concretização do presente invento foi apresentada para reconhecimento de mensagens comerciais difundidas por televisão, será entendido que os sistemas e métodos para reconhecimento de padrões contínuos de segmentos de difusão de acordo com o presente invento podem ser utilizados para outras finalidades, tais como determinação de que programas, canções ou outros trabalhos que foram difundidos, por exemplo, para determinação de pagamentos de direitos de autor, ou então para determinar os programas, mensagens comerciais ou outros segmentos que foram recebidos por membros da audiência que participem num estudo de medida de audiência.
Será apreciado que os sistemas e métodos do presente invento podem ser implementados no todo ou em parte através da utilização de circuitos analógicos ou digitais ou de ambos e que os elementos e passos dos mesmos podem ser implementados ou concretizados através da utilização de qualquer de uma variedade de configurações e dispositivos de sistemas e subsistemas e que os vários passos e elementos podem ser concretizados e implementados com a utilização de processadores baseados em suporte lógico ou suporte físico.
Apesar das concretizações específicas do invento terem sido descritas em detalhe aqui com referência aos desenhos em anexo, entende-se que o invento não está limitado a estas concretizações precisas, e que várias alterações e modificações podem ser efectuadas por quem for especializado na técnica sem afastamento do âmbito do invento como definido nas reivindicações em anexo. 105
ΕΡ 1 261 155 /PT
Será apreciado a partir da descrição acima que o presente pedido também proporciona um método de reconhecimento de segmentos de difusão, que compreende os passos de: produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; armazenamento de cada uma das ditas assinaturas para formar uma base de dados de assinaturas de segmentos de difusão; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão monitorizado; comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma das assinaturas de segmentos de difusão da base de dados para determinar se existe uma coincidência entre as mesmas; e avaliação da validade de uma coincidência de um segmento de difusão monitorizado por concretização de, pelo menos, um de: (a) determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados; (b) determinação se o segmento de difusão monitorizado se sobrepõe a outro segmento de difusão monitorizado para o qual uma coincidência tenha sido aceite de acordo com critérios predeterminados; e (c) determinação se a coincidência está de acordo com um perfil predeterminado de segmentos de falsa coincidência. Num método deste tipo o passo de avaliação da validade de uma coincidência compreende a determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados; para além disso, o passo de determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados compreende a determinação se a assinatura de um segmento de difusão monitorizado temporariamente adjacente corresponde a uma assinatura na dita base de dados. Além disso, o passo de formação de uma assinatura que representa o segmento de difusão monitorizado compreende a formação de uma assinatura a partir de um sinal de vídeo do dito segmento de difusão monitorizado e o passo de determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados compreende a determinação se o sinal de video do segmento de difusão monitorizado inclui um desvanecimento para preto em, pelo menos, uma extremidade do mesmo. O passo de avaliação da validade de uma coincidência pode compreender a determinação se o segmento de 106
ΕΡ 1 261 155 /PT difusão monitorizado se sobrepõe a outro segmento de difusão monitorizado para o qual uma coincidência foi aceite de acordo com critérios predeterminados, e/ou a determinação se a coincidência está de acordo com um perfil predeterminado de segmentos de falsa coincidência; o passo de determinação se a coincidência está de acordo com um perfil predeterminado de segmentos de falsa coincidência pode compreender a formação do dito perfil de segmentos de falsa coincidência com base em, pelo menos, um de (1) o comprimento do segmento de difusão monitorizado, (2) a dissimilitude da dita, pelo menos, uma das assinaturas de segmento de difusão da base de dados de outras assinaturas na base de dados e (3) a frequência de ocorrência de, pelo menos, porções da dita, pelo menos, uma das assinaturas de segmentos de difusão conforme produzidas. O passo de comparação das assinaturas pode compreender a determinação de uma diferença entre a assinatura que representa o segmento de difusão monitorizado e a, pelo menos, uma das assinaturas de segmento de difusão da base de dados e comparação da diferença determinada com um valor de limiar de erro predeterminado correspondente com a, pelo menos, uma das assinaturas de segmentos de difusão, e em que o passo de determinação se a coincidência está de acordo com um perfil predeterminado de segmentos de falsa coincidência compreende a formação do dito perfil de segmentos de falsa coincidência com base em, pelo menos, um de (1) o dito valor de limiar de erro predeterminado, e (2) uma diferença entre o dito valor de limiar de erro predeterminado e a dita diferença determinada. O passo de formação do dito perfil de segmentos de falsa coincidência pode compreender a formação de uma combinação linear de valores que representa (1) o dito valor de limiar de erro predeterminado, (2) a dita diferença entre o dito valor de limiar de erro predeterminado e a dita diferença determinada, (3) o comprimento do segmento de difusão monitorizado, (4) as dissimilitudes da dita, pelo menos, uma das assinaturas de segmentos de difusão da base de dados de outras assinaturas na base de dados, e (5) a frequência de ocorrência de, pelo menos, porções da dita, pelo menos, uma das assinaturas de segmento de difusão conforme produzida.
Será também apreciado a partir da descrição acima que é apresentado um sistema de reconhecimento de segmentos de 107
ΕΡ 1 261 155 /PT difusão, que compreende: meios para produção de uma assinatura para cada um da pluralidade de segmentos de difusão que se destinam a ser reconhecidos; meios para armazenamento de cada uma das ditas assinaturas para formar uma base de dados de assinaturas de segmentos de difusão; meios para monitorizar um segmento de difusão; meios para formação de uma assinatura que representa o segmento de difusão monitorizado; meios para comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma das assinaturas de segmento de difusão da base de dados para determinar se existe coincidência entre as mesmas; e meios para avaliação da validade de uma coincidência de um segmento de difusão monitorizado por concretização de, pelo menos, um de: (a) determinação se o segmento de difusão monitorizado está temporariamente delimitado por eventos de sinal predeterminados; (b) determinação se o segmento de difusão monitorizado se sobrepõe a outro segmento de difusão monitorizado para o qual uma coincidência tenha sido aceite de acordo com critérios predeterminados; e (c) determinação se a coincidência está de acordo com um perfil predeterminado de segmentos de falsa coincidência.
Será também apreciado da descrição antecedente que foi apresentado um método de reconhecimento de segmentos de difusão, que compreende os passos de: produção de uma assinatura para cada um da pluralidade de segmentos de difusão que se destinam a ser reconhecidos; armazenamento de cada uma das ditas assinaturas para formar uma base de dados de assinaturas de segmentos de difusão; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão monitorizado; comparação da assinatura que representa o segmento de difusão monitorizado com cada uma de uma pluralidade de assinaturas de segmentos de difusão da base de dados para determinar se existe uma coincidência entre as mesmas de acordo com um primeiro nivel de tolerância de erro; avaliação se a coincidência fica numa classe de coincidências de aceitação questionável com base em critérios de avaliação predeterminados; e se a coincidência pertence à dita classe de coincidências de aceitação questionável, comparação da assinatura que representa o segmento de difusão monitorizado com a assinatura do segmento de difusão correspondente da base de dados através da 108 ΕΡ 1 261 155 /PT utilização de um segundo nivel de tolerância de erro que aceita coincidências com níveis de erro relativamente mais elevados do que coincidências aceitáveis de acordo com o primeiro nível de tolerância de erro. O passo de avaliação se a coincidência pertence a uma classe de coincidências de aceitação questionável compreende, pelo menos, um de determinação se o segmento de difusão monitorizado está temporariamente delimitado apenas numa extremidade do mesmo por, pelo menos, um de uma pluralidade de eventos de sinal predeterminados e determinação para um segmento de difusão monitorizado que não está delimitado em qualquer extremidade pelo dito, pelo menos, um de uma pluralidade de eventos de sinal predeterminados, se o dito segmento de difusão monitorizado se ajusta a um perfil predeterminado de segmentos de falsa coincidência. O passo de determinação se o segmento de difusão monitorizado está temporariamente delimitado apenas numa extremidade do mesmo por, pelo menos, um de uma pluralidade de eventos de sinal predeterminados compreende a determinação se o segmento de difusão monitorizado está temporariamente delimitado apenas numa extremidade por outro segmento de difusão monitorizado que corresponde a uma assinatura na dita base de dados. O passo de formação de uma assinatura que representa o segmento de difusão monitorizado compreende a formação de uma assinatura a partir de um sinal de vídeo do dito segmento de difusão monitorizado e o passo de determinação se o segmento de difusão monitorizado está temporariamente delimitado apenas numa extremidade do mesmo por, pelo menos, um de uma pluralidade de eventos de sinal predeterminados compreende a determinação se o segmento de difusão monitorizado está delimitado apenas numa extremidade do mesmo por, pelo menos, um de (1) outro segmento de difusão monitorizado que corresponde a uma assinatura na dita base de dados, e (2) um desvanecimento para preto do dito sinal de vídeo. O passo de produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos compreende a formação de primeira e segunda assinaturas a partir de sinais áudio e vídeo, respectivamente, dos ditos cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; o passo de formação de uma assinatura que representa o segmento de difusão monitorizado compreende a formação de terceira e quarta assinaturas a 109
ΕΡ 1 261 155 /PT partir de sinais áudio e video, respectivamente, do segmento de difusão monitorizado; o passo de comparação das assinaturas compreende a comparação de terceira e quarta assinaturas com cada uma da pluralidade de primeira e segunda assinaturas, respectivamente, da base de dados; e o passo de avaliação se a coincidência pertence a uma classe de coincidências de aceitação questionável compreende a determinação de uma coincidência da terceira assinatura com uma respectiva da pluralidade de primeiras assinaturas e uma coincidência da quarta assinatura com uma respectiva da pluralidade de segundas assinaturas pertence à dita classe de coincidências de aceitação questionável quando a outra assinatura correspondente não corresponde com a respectiva da pluralidade de primeira e segunda assinaturas.
Também será apreciado da apresentação acima que foi apresentado um sistema de reconhecimento de segmentos de difusão, que compreende: meios para produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; meios para armazenamento de cada uma das ditas assinaturas para formar uma base de dados de assinaturas de segmentos de difusão; meios para monitorizar um segmento de difusão; meios para formação de uma assinatura que representa o segmento de difusão monitorizado; meios para comparação da assinatura que representa o segmento de difusão monitorizado com cada assinatura de segmento de uma pluralidade de assinaturas de segmentos de difusão da base de dados para determinar se existe uma coincidência entre as mesmas de acordo com um primeiro nível de tolerância de erro; e meios para avaliação se a coincidência pertence a uma classe de coincidências de aceitação questionável com base em critérios de avaliação predeterminados, e no caso afirmativo, para comparação da assinatura que representa o segmento de difusão monitorizado com a assinatura do segmento de difusão correspondente da base de dados através da utilização de um segundo nível de tolerância de erro que aceita coincidências com níveis de erro relativamente mais elevados do que coincidências aceitáveis de acordo com o primeiro nível de tolerância de erro. 110
ΕΡ 1 261 155 /PT
Será também apreciado da apresentação anterior que o pedido também se refere a um método para actualização de uma base de dados de reconhecimento de segmentos de difusão que armazena assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreende os passos de: monitorização de um sinal de difusão para detectar eventos de sinal predeterminados que indicam possíveis segmentos de difusão de interesse correspondentes com intervalos de sinais de difusão monitorizados respectivos; determinação se, pelo menos, dois segmentos de difusão possíveis alternativos de interesse são detectados para um intervalo do sinal de difusão monitorizado; atribuição de prioridade a um dos ditos, pelo menos, dois segmentos de difusão possíveis alternativos de interesse com base em critérios predeterminados; e armazenamento de uma assinatura na base de dados correspondente com a prioridade atribuída dos ditos, pelo menos, dois segmentos de difusão possíveis alternativos de interesse.
Será também apreciado da apresentação anterior que o pedido também se refere a um sistema para actualização de uma base de dados de reconhecimento de segmentos de difusão que armazena assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreende: meios para monitorizar um sinal de difusão para detectar eventos de sinal predeterminados que indicam possíveis segmentos de difusão de interesse correspondentes com respectivos intervalos de sinais de difusão monitorizados; determinação se, pelo menos, dois segmentos de difusão possíveis alternativos de interesse são detectados para um intervalo do sinal de difusão monitorizado; meios para a atribuição de prioridade a um dos ditos, pelo menos, dois segmentos de difusão possíveis alternativos de interesse com base em critérios predeterminados; e meios para armazenamento de uma assinatura na base de dados correspondente com a prioridade atribuída dos ditos, pelo menos, dois segmentos de difusão possíveis alternativos de interesse.
Será também apreciado da apresentação anterior que o pedido também se refere a um método para captura selectiva de, pelo menos, um de um sinal de difusão áudio e de um sinal de difusão vídeo para utilização na actualização de uma base 111
ΕΡ 1 261 155 /PT de dados de reconhecimento de segmentos de difusão que armazena assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreende os passos de armazenamento temporário de, pelo menos, um de um sinal de difusão áudio e um sinal de difusão video de uma emissão monitorizada; detecção de eventos de sinal predeterminados que indicam possíveis segmentos novos de difusão de interesse da emissão monitorizada; selecção de intervalos da emissão monitorizada como possíveis segmentos novos de difusão de interesse com base nos ditos eventos de sinal predeterminados; atribuição de um primeiro nível de captura a um primeiro intervalo seleccionado com base em características predeterminadas do mesmo que indicam que o dito primeiro intervalo seleccionado é provavelmente um novo segmento de interesse; a atribuição de um segundo nível de captura a um segundo intervalo seleccionado com base em características predeterminadas do mesmo que indicam que o segundo intervalo seleccionado é relativamente menos provável do que o primeiro intervalo seleccionado de ser um novo segmento de interesse; armazenamento de uma assinatura correspondente com o primeiro intervalo seleccionado na base de dados e captura de, pelo menos, um dos sinais de difusão vídeo e áudio temporariamente armazenados correspondente com o primeiro intervalo seleccionado para transmissão a um operador de estação de trabalho para identificação de segmento; armazenamento de uma assinatura correspondente com o segundo intervalo seleccionado na base de dados; e eliminação do sinal armazenado temporariamente dos sinais de difusão vídeo e áudio correspondentes com o segundo intervalo seleccionado. 0 método pode também compreender os passos de detecção de uma coincidência da assinatura armazenada que representa o segundo intervalo seleccionado com uma assinatura que representa um segmento recebido de seguida e captura de, pelo menos, um de dados áudio e vídeo do segmento recebido de seguida para transmissão para o operador de estação de trabalho para reconhecimento de um segmento novo.
Será também apreciado da apresentação anterior que o pedido também se refere a um sistema para captura selectiva de, pelo menos, um de um sinal de difusão áudio e um sinal de difusão vídeo para utilização na actualização de uma base de dados de reconhecimento de segmentos de difusão que armazena 112 ΕΡ 1 261 155 /PT assinaturas para utilização no reconhecimento de segmentos de difusão de interesse, que compreende: meios para armazenar de forma temporária, pelo menos, um de um sinal de difusão áudio e de um sinal de difusão video de uma emissão monitorizada; meios para detecção de eventos de sinal predeterminados que indicam possíveis segmentos novos de difusão de interesse da emissão monitorizada; meios para selecção de intervalos da emissão monitorizada como possíveis segmentos novos de difusão de interesse com base nos ditos eventos de sinal predeterminados; meios para atribuição de um primeiro nível de captura a um primeiro intervalo seleccionado com base em características predeterminadas do mesmo que indicam que o dito primeiro intervalo seleccionado será provavelmente um segmento novo de interesse; meios para atribuição de um segundo nível de captura a um segundo intervalo seleccionado com base em características predeterminadas do mesmo que indicam que o segundo intervalo seleccionado é relativamente menos provável do que o primeiro intervalo seleccionado de ser um segmento novo de interesse; meios para armazenamento de uma assinatura correspondente com o primeiro intervalo seleccionado na base de dados e captura de, pelo menos, um dos sinais de difusão vídeo e áudio temporariamente armazenados correspondente com o primeiro intervalo seleccionado para transmissão para um operador de estação de trabalho para identificação segmentada; meios para armazenamento de uma assinatura correspondente com o segundo intervalo seleccionado na base de dados; e meios para eliminação do sinal armazenado temporariamente dos sinais de difusão vídeo e áudio correspondentes com o segundo intervalo seleccionado.
Será também apreciado da apresentação anterior que o pedido também se refere a um método de reconhecimento de segmentos de difusão, que compreende os passos de: produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; para cada assinatura produzida, determinação de uma probabilidade que esta assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão; produção de uma assinatura adicional para o dito cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos quando a dita probabilidade que a 113
ΕΡ 1 261 155 /PT dita assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão é inferior a um valor predeterminado; armazenamento de cada assinatura produzida para formar uma base de dados; monitorização de um segmento de difusão; formação de uma assinatura que representa o segmento de difusão monitorizado; e comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados. O passo de produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos pode compreender a formação de primeira e segunda assinaturas para uma emissão que inclui um sinal de video e um sinal áudio, caracterizando a primeira assinatura o sinal de video e caracterizando a segunda assinatura o sinal áudio, o passo de formação de uma assinatura que representa o segmento de difusão monitorizado compreende a formação de terceira e quarta assinaturas respectivamente que representam sinais de video e áudio incluídos no segmento de difusão monitorizado e o passo de comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura compreende a comparação da terceira e quarta assinaturas com a primeira e segunda assinaturas, respectivamente, para determinar as correspondentes coincidências das mesmas. 0 passo de produção de uma probabilidade correspondente com base no critério pode compreender a formação de uma probabilidade correspondente com base no critério para, pelo menos, uma da primeira e segunda assinaturas e o passo de determinação se é de aceitar a dita coincidência compreende a determinação que a outra da primeira e segunda assinaturas não corresponde com uma correspondente das terceira e quarta assinaturas quando (1) a probabilidade correspondente com base no critério da, pelo menos, uma das primeira e segunda assinaturas indica que a mesma deverá ter correspondido com a outra das correspondentes terceira e quarta assinaturas, e (2) a comparação da, pelo menos, uma das primeira e segunda assinaturas com a correspondente das terceira e quarta assinaturas produz uma determinação de que uma coincidência da mesma não ocorreu. 0 método pode também compreender os passos de determinação das respectivas probabilidades de falsa coincidência na primeira e segunda assinaturas pode fazer corresponder assinaturas de segmentos de difusão 114
ΕΡ 1 261 155 /PT monitorizados que não correspondem com o segmento de difusão de onde foram produzidas as primeira e segunda assinaturas e determinação se é aceitável, pelo menos, uma das ditas respectivamente coincidências com base nas ditas respectivas probabilidades de falsa coincidência. 0 passo de determinação se é aceitável, pelo menos, uma das ditas respectivamente coincidências pode compreender a determinação de não aceitar qualquer das ditas respectivamente coincidências quando (1) uma coincidência de ambas não foi determinada e (2) ambas das ditas respectivas probabilidades de falsa coincidência excedem um nível predeterminado, ou determinação de aceitar qualquer das ditas respectivamente coincidências quando ambas das ditas respectivas probabilidades de falsa coincidência são inferiores a um nivel predeterminado. 0 passo de determinação das respectivas probabilidades de falsa coincidência pode compreender a determinação das ditas respectivas probabilidades de falsa coincidência com base em (1) uma quantidade de informação nas correspondentes da primeira e segunda assinaturas e (2), pelo menos, uma distribuição de valores de assinaturas de segmentos de difusão.
Será também apreciado da apresentação anterior que o pedido também se refere a um sistema de reconhecimento de segmentos de difusão, que compreende: meios para produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; meios para determinação de uma probabilidade de que cada assinatura produzida irá corresponder com uma assinatura produzida após a redifusão do correspondente segmento de difusão; meios para produção de uma assinatura adicional para o dito cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos quando a dita probabilidade que a dita assinatura produzida irá corresponder com uma assinatura produzida após a redifusão do correspondente segmento de difusão é inferior a um valor predeterminado; meios para armazenamento de cada assinatura produzida para formar uma base de dados; meios para monitorizar um segmento de difusão; meios para formação de uma assinatura que representa o segmento de difusão monitorizado; e meios para comparação da 115
ΕΡ 1 261 155 /PT assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados.
Será também apreciado da apresentação anterior que o pedido também se refere a um método de reconhecimento de segmentos de difusão, que compreende os passos de: produção de uma assinatura digital para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos, incluindo cada uma das ditas assinaturas digitais uma pluralidade de valores de bit que caracterizam uma correspondente da dita pluralidade de segmentos de difusão; para cada assinatura digital produzida, determinação de um número provável de valores de bit da mesma que irá corresponder com os valores de bit de uma assinatura digital produzida após a redifusão do correspondente segmento de difusão e produção de uma probabilidade correspondente com base no valor de coincidência para utilização na determinação se a dita cada assinatura digital produzida corresponde a uma assinatura digital de um segmento de difusão recebido subsequentemente; armazenamento de cada assinatura produzida e da sua probabilidade correspondente com base no valor de coincidência para formar uma base de dados; monitorização de um segmento de difusão; formação de uma assinatura digital com uma pluralidade de valores de bit que representam o segmento de difusão monitorizado; comparação da assinatura digital que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura digital armazenada na base de dados; e determinação se a assinatura digital que representa o segmento de difusão monitorizado corresponde a, pelo menos, uma assinatura digital que utiliza a probabilidade correspondente com base no valor de coincidência. 0 passo de produção de uma probabilidade correspondente com base no valor de coincidência pode compreender a produção de um valor de limiar de erro que representa um número máximo de bits correspondentes da dita assinatura digital que representa o dito segmento de difusão monitorizado e uma correspondente da dita, pelo menos, uma assinatura digital que pode diferir.
Será também apreciado da apresentação anterior que o pedido também se refere a um sistema de reconhecimento de segmentos de difusão, que compreende: meios para produção de uma assinatura digital para cada um de uma pluralidade de 116
ΕΡ 1 261 155 /PT segmentos de difusão que se destinam a ser reconhecidos, incluindo a dita cada dita assinatura digital uma pluralidade de valores de bit que caracterizam um correspondente da dita pluralidade de segmentos de difusão; meios para determinação de um número provável de valores de bit de cada assinatura digital produzida que irão corresponder com os valores de bit de uma assinatura digital produzida após a redifusão do correspondente segmento de difusão e produção de uma probabilidade correspondente com base no valor de coincidência para utilização na determinação se a dita cada uma assinatura digital produzida corresponde a uma assinatura digital de um segmento de difusão recebido subsequentemente; meios para armazenamento de cada assinatura produzida e da sua probabilidade correspondente com base no valor de coincidência para formar uma base de dados; meios para monitorizar um segmento de difusão; meios para formação de uma assinatura digital com uma pluralidade de valores de bit que representam o segmento de difusão monitorizado; meios de comparação da assinatura digital que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura digital armazenada na base de dados; e meios para determinação se a assinatura digital que representa o segmento de difusão monitorizado corresponde a, pelo menos, uma assinatura digital que utilizam a probabilidade correspondente com base no valor de coincidência.
Será também apreciado da apresentação anterior que o pedido também se refere a um método de reconhecimento de segmentos de difusão, que compreende os passos de: produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; para cada assinatura produzida, determinação de uma probabilidade que esta assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão; produção de uma assinatura adicional para o dito cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos quando a dita probabilidade que a dita assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão é inferior a um valor predeterminado; armazenamento de cada assinatura produzida para formar uma base de dados; monitorização de um segmento de difusão; formação de uma 117
ΕΡ 1 261 155 /PT assinatura que representa o segmento de difusão monitorizado; e comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados.
Será também apreciado da apresentação anterior que o pedido também se refere a um sistema de reconhecimento de segmentos de difusão, que compreende: meios para produção de uma assinatura para cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos; meios para determinação de uma probabilidade que cada assinatura produzida corresponda com a assinatura produzida após a redifusão do correspondente segmento de difusão; meios para produção de uma assinatura adicional para o dito cada um de uma pluralidade de segmentos de difusão que se destinam a ser reconhecidos quando a dita probabilidade que a dita assinatura produzida corresponda com uma assinatura produzida após a redifusão do correspondente segmento de difusão é inferior a um valor predeterminado; meios para armazenamento de cada assinatura produzida para formar uma base de dados; meios para monitorizar um segmento de difusão; meios para formação de uma assinatura que representa o segmento de difusão monitorizado; meios for comparação da assinatura que representa o segmento de difusão monitorizado com, pelo menos, uma assinatura armazenada na base de dados.
Lisboa
Claims (10)
- ΕΡ 1 261 155 /PT 1/4 REIVINDICAÇÕES 1 - Método (300-312) de produção de uma assinatura a partir de um sinal de difusão áudio para utilização no reconhecimento de sinais de difusão, que compreende os passos de: formação de um primeiro grupo de uma pluralidade de valores de banda de frequências, sendo cada valor derivado de um segmento do dito sinal de difusão áudio numa respectiva banda de frequências predeterminada; formação de um segundo grupo de uma pluralidade de valores de banda de frequências, sendo cada valor derivado de um segmento do dito sinal de difusão áudio numa respectiva banda de frequências predeterminada, em que os valores do segundo grupo representam segmentos do dito sinal de difusão áudio nas mesmas respectivas bandas de frequências predeterminadas como valores no primeiro grupo; e caracterizado por compreender: a comparação de cada um do primeiro grupo da dita pluralidade de valores de banda de frequências com um respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências que representam um segmento do dito sinal de difusão áudio na mesma respectiva banda de frequências predeterminada, representando cada respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências um segmento do dito sinal de difusão áudio, em que, pelo menos, uma parte do qual foi difundida antes do segmento do dito sinal de difusão áudio, representado pelo valor correspondente do dito primeiro grupo da dita pluralidade de valores de banda de frequências; e a formação da dita assinatura com base nas comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências. ΕΡ 1 261 155 /PT 2/4
- 2 - Método de acordo com a reivindicação 1, em que a formação do dito primeiro grupo de valores de banda de frequências compreende a formação de uma pluralidade de sinais de nível de potência (306), representando cada um deles um nível de potência do dito sinal de difusão áudio numa respectiva banda das ditas bandas de frequência predeterminadas.
- 3 - Método de acordo com a reivindicação 2, em que a formação do primeiro grupo de uma pluralidade de valores de banda de frequências compreende a formação de primeiros sinais de banda de frequências, representando cada um deles uma característica do dito sinal de difusão áudio numa respectiva banda das ditas bandas de frequência predeterminadas e a transformação de cada um dos ditos primeiros sinais de banda de frequências pela divisão de cada da dita pluralidade de sinais de nível de potência por uma combinação linear de outros dos ditos primeiros sinais de banda de frequências.
- 4 - Método de acordo com a reivindicação 1, em que a formação da dita assinatura compreende a inclusão na assinatura dos dados produzidos a partir das comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências.
- 5 - Método de acordo com a reivindicação 1, em que a comparação dos primeiro e segundo grupos de valores de banda de frequências compreende a produção de valores de diferença que representam as diferenças entre os primeiros e os segundos valores de banda de frequências.
- 6 - Método de acordo com a reivindicação 5, em que a formação da dita assinatura compreende a inclusão na assinatura de dados produzidos a partir dos valores de diferença.
- 7 - Sistema (250) para produção de uma assinatura a partir de um sinal de difusão áudio para utilização no reconhecimento de sinais de difusão, que compreende: ΕΡ 1 261 155 /PT 3/4 meios para formação de um primeiro grupo de uma pluralidade de valores de banda de frequências, sendo cada valor derivado de um segmento do dito sinal de difusão áudio numa respectiva banda de frequências predeterminada; meios para formação de um segundo grupo de uma pluralidade de valores de banda de frequências, sendo cada valor derivado de um segmento do sinal de difusão áudio numa respectiva banda de frequências predeterminada, em que valores do segundo grupo representam segmentos do dito sinal de difusão áudio nas mesmas respectivas bandas de frequências predeterminadas como valores no primeiro grupo; e caracterizado por: meios para a comparação de cada um do primeiro grupo da dita pluralidade de valores de banda de frequências com um respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências que representam um segmento do dito sinal de difusão áudio na mesma respectiva banda de frequências predeterminada, representando cada respectivo valor do segundo grupo da dita pluralidade de valores de banda de frequências um segmento do dito sinal de difusão áudio, em que, pelo menos, uma parte do qual foi difundida antes do segmento do dito sinal de difusão áudio, representado pelo valor correspondente do dito primeiro grupo da dita pluralidade de valores de banda de frequências; e meios para formação da dita assinatura com base na comparação dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências.
- 8 - Sistema (250) de acordo com a reivindicação 7, em que os meios para formação da dita assinatura estão operativos para incluírem na assinatura os dados produzidos a partir das comparações dos primeiro e segundo grupos da dita pluralidade de valores de banda de frequências. ΕΡ 1 261 155 /PT 4/4
- 9 - Sistema (250) da reivindicação 7, em que os meios para comparação dos primeiro e segundo grupos de valores de banda de frequências estão operativos para produzirem valores de diferença que representam diferenças entre os primeiro e segundo valores de banda de frequências.
- 10 - Sistema (250) da reivindicação 9, em que os meios para formação da dita assinatura estão operativos para incluírem na assinatura os dados produzidos a partir dos valores de diferença. Lisboa,
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/876,578 US5436653A (en) | 1992-04-30 | 1992-04-30 | Method and system for recognition of broadcast segments |
Publications (1)
Publication Number | Publication Date |
---|---|
PT1261155E true PT1261155E (pt) | 2007-07-03 |
Family
ID=25368063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PT02076018T PT1261155E (pt) | 1992-04-30 | 1993-04-30 | Método e sistema para reconhecimento de segmentos de difusão |
Country Status (12)
Country | Link |
---|---|
US (5) | US5436653A (pt) |
EP (2) | EP0748563B1 (pt) |
JP (1) | JPH08500471A (pt) |
AT (2) | ATE358366T1 (pt) |
AU (3) | AU678163B2 (pt) |
CA (2) | CA2134748C (pt) |
DE (2) | DE69334130T2 (pt) |
DK (1) | DK1261155T3 (pt) |
ES (1) | ES2284777T3 (pt) |
HK (1) | HK1051938A1 (pt) |
PT (1) | PT1261155E (pt) |
WO (1) | WO1993022875A1 (pt) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8060372B2 (en) | 2007-02-20 | 2011-11-15 | The Nielsen Company (Us), Llc | Methods and appratus for characterizing media |
US8369972B2 (en) | 2007-11-12 | 2013-02-05 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8458737B2 (en) | 2007-05-02 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
US8600531B2 (en) | 2008-03-05 | 2013-12-03 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
Families Citing this family (565)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6081750A (en) * | 1991-12-23 | 2000-06-27 | Hoffberg; Steven Mark | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US6418424B1 (en) | 1991-12-23 | 2002-07-09 | Steven M. Hoffberg | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
USRE47908E1 (en) | 1991-12-23 | 2020-03-17 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
USRE46310E1 (en) | 1991-12-23 | 2017-02-14 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5903454A (en) * | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
USRE48056E1 (en) | 1991-12-23 | 2020-06-16 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US5436653A (en) * | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
US5721788A (en) | 1992-07-31 | 1998-02-24 | Corbis Corporation | Method and system for digital image signatures |
US6301369B2 (en) | 1992-07-31 | 2001-10-09 | Digimarc Corporation | Image marking to permit later identification |
US5903317A (en) * | 1993-02-14 | 1999-05-11 | Orad Hi-Tech Systems Ltd. | Apparatus and method for detecting, identifying and incorporating advertisements in a video |
JP3563072B2 (ja) * | 1993-08-31 | 2004-09-08 | インテレッセンゲマインシャフト フュア ルントフンクシュッツレヒテ ゲゼルシャフト ミット ベシュレンクテル ハフツング シュッツレヒツフェルヴェルツング ウント コンパニー コマンディートゲゼルシャ | 不所望なビデオシーンの検出方法及び装置 |
US6611607B1 (en) | 1993-11-18 | 2003-08-26 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US6614914B1 (en) | 1995-05-08 | 2003-09-02 | Digimarc Corporation | Watermark embedder and reader |
US5768426A (en) * | 1993-11-18 | 1998-06-16 | Digimarc Corporation | Graphics processing system employing embedded code signals |
US6516079B1 (en) | 2000-02-14 | 2003-02-04 | Digimarc Corporation | Digital watermark screening and detecting strategies |
US6345104B1 (en) | 1994-03-17 | 2002-02-05 | Digimarc Corporation | Digital watermarks and methods for security documents |
US5748763A (en) | 1993-11-18 | 1998-05-05 | Digimarc Corporation | Image steganography system featuring perceptually adaptive and globally scalable signal embedding |
US6983051B1 (en) | 1993-11-18 | 2006-01-03 | Digimarc Corporation | Methods for audio watermarking and decoding |
US5822436A (en) * | 1996-04-25 | 1998-10-13 | Digimarc Corporation | Photographic products and methods employing embedded information |
US6757406B2 (en) | 1993-11-18 | 2004-06-29 | Digimarc Corporation | Steganographic image processing |
US6122403A (en) | 1995-07-27 | 2000-09-19 | Digimarc Corporation | Computer system linked by using information in data objects |
US7313251B2 (en) | 1993-11-18 | 2007-12-25 | Digimarc Corporation | Method and system for managing and controlling electronic media |
US6449377B1 (en) | 1995-05-08 | 2002-09-10 | Digimarc Corporation | Methods and systems for watermark processing of line art images |
US5841978A (en) | 1993-11-18 | 1998-11-24 | Digimarc Corporation | Network linking method using steganographically embedded data objects |
US6944298B1 (en) | 1993-11-18 | 2005-09-13 | Digimare Corporation | Steganographic encoding and decoding of auxiliary codes in media signals |
US7171016B1 (en) | 1993-11-18 | 2007-01-30 | Digimarc Corporation | Method for monitoring internet dissemination of image, video and/or audio files |
US6560349B1 (en) | 1994-10-21 | 2003-05-06 | Digimarc Corporation | Audio monitoring using steganographic information |
US8094949B1 (en) | 1994-10-21 | 2012-01-10 | Digimarc Corporation | Music methods and systems |
US7724919B2 (en) | 1994-10-21 | 2010-05-25 | Digimarc Corporation | Methods and systems for steganographic processing |
US6583825B1 (en) * | 1994-11-07 | 2003-06-24 | Index Systems, Inc. | Method and apparatus for transmitting and downloading setup information |
US20030213001A1 (en) | 1994-11-07 | 2003-11-13 | Index Systems, Inc. | Method and apparatus for transmitting and downloading setup information |
US5708477A (en) * | 1994-12-01 | 1998-01-13 | Forbes; Scott Jared | Video signal identifier for controlling a VCR and television based on the occurrence of commercials |
JPH11506575A (ja) | 1995-03-07 | 1999-06-08 | インターバル リサーチ コーポレイション | 情報の選択記憶システム及び方法 |
US6760463B2 (en) | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
US7805500B2 (en) | 1995-05-08 | 2010-09-28 | Digimarc Corporation | Network linking methods and apparatus |
US7224819B2 (en) | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US7486799B2 (en) * | 1995-05-08 | 2009-02-03 | Digimarc Corporation | Methods for monitoring audio and images on the internet |
US5864358A (en) * | 1995-06-26 | 1999-01-26 | Matsushita Electric Industrial Co., Ltd. | Method for switching programs in digital broadcasting and digital broadcast receiving apparatus |
US7711564B2 (en) | 1995-07-27 | 2010-05-04 | Digimarc Corporation | Connected audio and other media objects |
US7562392B1 (en) * | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
US6577746B1 (en) | 1999-12-28 | 2003-06-10 | Digimarc Corporation | Watermark-based object linking and embedding |
US6505160B1 (en) * | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
US6829368B2 (en) | 2000-01-26 | 2004-12-07 | Digimarc Corporation | Establishing and interacting with on-line media collections using identifiers in media signals |
US6411725B1 (en) | 1995-07-27 | 2002-06-25 | Digimarc Corporation | Watermark enabled video objects |
US5905522A (en) * | 1995-08-31 | 1999-05-18 | Microsoft Corporation | Resource allocation method for interactive televideo system |
GB9519087D0 (en) * | 1995-09-19 | 1995-11-22 | Cursor Positioning Sys Ltd | Navigation and tracking system |
US5767893A (en) * | 1995-10-11 | 1998-06-16 | International Business Machines Corporation | Method and apparatus for content based downloading of video programs |
EP0880840A4 (en) * | 1996-01-11 | 2002-10-23 | Mrj Inc | DEVICE FOR CONTROLLING ACCESS AND DISTRIBUTION OF DIGITAL PROPERTY |
US8180844B1 (en) | 2000-03-18 | 2012-05-15 | Digimarc Corporation | System for linking from objects to remote resources |
US5870754A (en) * | 1996-04-25 | 1999-02-09 | Philips Electronics North America Corporation | Video retrieval of MPEG compressed sequences using DC and motion signatures |
US7505605B2 (en) * | 1996-04-25 | 2009-03-17 | Digimarc Corporation | Portable devices and methods employing digital watermarking |
US20030056103A1 (en) | 2000-12-18 | 2003-03-20 | Levy Kenneth L. | Audio/video commerce application architectural framework |
JP3625344B2 (ja) * | 1996-11-05 | 2005-03-02 | 株式会社ビデオリサーチ | 視聴チャンネル検出装置 |
US6381341B1 (en) | 1996-05-16 | 2002-04-30 | Digimarc Corporation | Watermark encoding method exploiting biases inherent in original signal |
US8306811B2 (en) * | 1996-08-30 | 2012-11-06 | Digimarc Corporation | Embedding data in audio and detecting embedded data in audio |
US5987150A (en) * | 1996-08-30 | 1999-11-16 | Intel Corporation | Video capturing using on-screen graphics |
US7055166B1 (en) * | 1996-10-03 | 2006-05-30 | Gotuit Media Corp. | Apparatus and methods for broadcast monitoring |
US20020120925A1 (en) * | 2000-03-28 | 2002-08-29 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
US6088455A (en) * | 1997-01-07 | 2000-07-11 | Logan; James D. | Methods and apparatus for selectively reproducing segments of broadcast programming |
US20060280437A1 (en) * | 1999-01-27 | 2006-12-14 | Gotuit Media Corp | Methods and apparatus for vending and delivering the content of disk recordings |
US20030093790A1 (en) * | 2000-03-28 | 2003-05-15 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
US5999689A (en) | 1996-11-01 | 1999-12-07 | Iggulden; Jerry | Method and apparatus for controlling a videotape recorder in real-time to automatically identify and selectively skip segments of a television broadcast signal during recording of the television signal |
WO1998020675A1 (en) * | 1996-11-01 | 1998-05-14 | Jerry Iggulden | Method and apparatus for automatically identifying and selectively altering segments of a television broadcast signal in real-time |
US6771316B1 (en) * | 1996-11-01 | 2004-08-03 | Jerry Iggulden | Method and apparatus for selectively altering a televised video signal in real-time |
US6002443A (en) * | 1996-11-01 | 1999-12-14 | Iggulden; Jerry | Method and apparatus for automatically identifying and selectively altering segments of a television broadcast signal in real-time |
US7269330B1 (en) | 1996-11-01 | 2007-09-11 | Televentions, Llc | Method and apparatus for controlling a video recorder/player to selectively alter a video signal |
US6263507B1 (en) | 1996-12-05 | 2001-07-17 | Interval Research Corporation | Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data |
US5893062A (en) | 1996-12-05 | 1999-04-06 | Interval Research Corporation | Variable rate video playback with synchronized audio |
US7587323B2 (en) | 2001-12-14 | 2009-09-08 | At&T Intellectual Property I, L.P. | System and method for developing tailored content |
US8677384B2 (en) | 2003-12-12 | 2014-03-18 | At&T Intellectual Property I, L.P. | Methods and systems for network based capture of television viewer generated clickstreams |
US8640160B2 (en) * | 1997-01-06 | 2014-01-28 | At&T Intellectual Property I, L.P. | Method and system for providing targeted advertisements |
US6675383B1 (en) | 1997-01-22 | 2004-01-06 | Nielsen Media Research, Inc. | Source detection apparatus and method for audience measurement |
CA2196930C (en) * | 1997-02-06 | 2005-06-21 | Nael Hirzalla | Video sequence recognition |
GB9705999D0 (en) * | 1997-03-22 | 1997-05-07 | Philips Electronics Nv | Video signal analysis and storage |
US6427012B1 (en) | 1997-05-19 | 2002-07-30 | Verance Corporation | Apparatus and method for embedding and extracting information in analog signals using replica modulation |
US5940135A (en) * | 1997-05-19 | 1999-08-17 | Aris Technologies, Inc. | Apparatus and method for encoding and decoding information in analog signals |
EP0887958B1 (en) * | 1997-06-23 | 2003-01-22 | Liechti Ag | Method for the compression of recordings of ambient noise, method for the detection of program elements therein, devices and computer program therefor |
US5959683A (en) * | 1997-06-26 | 1999-09-28 | Xerox Corporation | System to remove artifacts in a digital image derived from a television signal |
US6031581A (en) * | 1997-06-26 | 2000-02-29 | Xerox Corporation | System for removing color bleed in a television image adapted for digital printing |
GB2327167A (en) * | 1997-07-09 | 1999-01-13 | Register Group Limited The | Identification of television commercials |
US6112053A (en) * | 1997-07-14 | 2000-08-29 | General Electric Company | Television viewership monitoring system employing audio channel and synchronization information |
US20060020614A1 (en) * | 1997-08-08 | 2006-01-26 | Kolawa Adam K | Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography |
GB9722324D0 (en) | 1997-10-22 | 1997-12-17 | Cambridge Positioning Sys Ltd | Positioning system for digital telephone networks |
US6961954B1 (en) | 1997-10-27 | 2005-11-01 | The Mitre Corporation | Automated segmentation, information extraction, summarization, and presentation of broadcast news |
US6173271B1 (en) * | 1997-11-26 | 2001-01-09 | California Institute Of Technology | Television advertising automated billing system |
IL122498A0 (en) * | 1997-12-07 | 1998-06-15 | Contentwise Ltd | Apparatus and methods for manipulating sequences of images |
US5973723A (en) * | 1997-12-12 | 1999-10-26 | Deluca; Michael Joseph | Selective commercial detector and eliminator apparatus and method |
US20050028194A1 (en) * | 1998-01-13 | 2005-02-03 | Elenbaas Jan Hermanus | Personalized news retrieval system |
ES2141039B1 (es) * | 1998-01-30 | 2000-10-16 | Mayo Audiovisual S A | Sistema automatico de deteccion y reconocimiento de anuncios televisados. |
DE19810114A1 (de) * | 1998-03-09 | 1999-09-16 | Stefan Weigelt | Suchverfahren für Musikstücke, insbesondere für Rundfunkempfangsgeräte |
JPH11298795A (ja) * | 1998-04-14 | 1999-10-29 | Sony Corp | 制御信号発生回路 |
US7689532B1 (en) | 2000-07-20 | 2010-03-30 | Digimarc Corporation | Using embedded data with file sharing |
DE69830163D1 (de) * | 1998-05-12 | 2005-06-16 | Nielsen Media Res Inc | Zuschauerermittlungssystem für digitales fernsehen |
US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
US6163510A (en) * | 1998-06-30 | 2000-12-19 | International Business Machines Corporation | Multimedia search and indexing system and method of operation using audio cues with signal thresholds |
US6100941A (en) * | 1998-07-28 | 2000-08-08 | U.S. Philips Corporation | Apparatus and method for locating a commercial disposed within a video data stream |
JP2000101439A (ja) * | 1998-09-24 | 2000-04-07 | Sony Corp | 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体 |
US6320623B1 (en) * | 1998-11-13 | 2001-11-20 | Philips Electronics North America Corporation | Method and device for detecting an event in a program of a video and/ or audio signal and for providing the program to a display upon detection of the event |
JP2000165806A (ja) * | 1998-11-30 | 2000-06-16 | Sony Corp | 情報処理装置および方法、並びに提供媒体 |
JP4026100B2 (ja) * | 1998-11-30 | 2007-12-26 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6934461B1 (en) * | 1999-01-05 | 2005-08-23 | Interval Research Corporation | Low attention recording, with particular application to social recording |
US7421723B2 (en) * | 1999-01-07 | 2008-09-02 | Nielsen Media Research, Inc. | Detection of media links in broadcast signals |
US6906743B1 (en) * | 1999-01-13 | 2005-06-14 | Tektronix, Inc. | Detecting content based defects in a video stream |
US6185527B1 (en) | 1999-01-19 | 2001-02-06 | International Business Machines Corporation | System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US20040255336A1 (en) * | 1999-03-30 | 2004-12-16 | Gotuit Video, Inc. | Methods and apparatus for simultaneous program viewing |
US7362946B1 (en) * | 1999-04-12 | 2008-04-22 | Canon Kabushiki Kaisha | Automated visual image editing system |
US6332120B1 (en) * | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
US7406214B2 (en) | 1999-05-19 | 2008-07-29 | Digimarc Corporation | Methods and devices employing optical sensors and/or steganography |
US8874244B2 (en) | 1999-05-19 | 2014-10-28 | Digimarc Corporation | Methods and systems employing digital content |
US7302574B2 (en) * | 1999-05-19 | 2007-11-27 | Digimarc Corporation | Content identifiers triggering corresponding responses through collaborative processing |
US8095796B2 (en) | 1999-05-19 | 2012-01-10 | Digimarc Corporation | Content identifiers |
US8055588B2 (en) * | 1999-05-19 | 2011-11-08 | Digimarc Corporation | Digital media methods |
US6871180B1 (en) | 1999-05-25 | 2005-03-22 | Arbitron Inc. | Decoding of information in audio signals |
GB9912724D0 (en) | 1999-06-01 | 1999-08-04 | Cambridge Positioning Sys Ltd | Radio positioning system |
US7013301B2 (en) * | 2003-09-23 | 2006-03-14 | Predixis Corporation | Audio fingerprinting system and method |
US20050038819A1 (en) * | 2000-04-21 | 2005-02-17 | Hicken Wendell T. | Music Recommendation system and method |
US6519564B1 (en) * | 1999-07-01 | 2003-02-11 | Koninklijke Philips Electronics N.V. | Content-driven speech-or audio-browser |
US8326584B1 (en) | 1999-09-14 | 2012-12-04 | Gracenote, Inc. | Music searching methods based on human perception |
US7174293B2 (en) * | 1999-09-21 | 2007-02-06 | Iceberg Industries Llc | Audio identification system and method |
US7194752B1 (en) | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
US6941275B1 (en) | 1999-10-07 | 2005-09-06 | Remi Swierczek | Music identification system |
US7155735B1 (en) | 1999-10-08 | 2006-12-26 | Vulcan Patents Llc | System and method for the broadcast dissemination of time-ordered data |
US6469749B1 (en) * | 1999-10-13 | 2002-10-22 | Koninklijke Philips Electronics N.V. | Automatic signature-based spotting, learning and extracting of commercials and other video content |
CA2809775C (en) * | 1999-10-27 | 2017-03-21 | The Nielsen Company (Us), Llc | Audio signature extraction and correlation |
WO2001035676A1 (en) * | 1999-11-11 | 2001-05-17 | Contentwise Ltd | Method and system for global broadcast monitoring |
JP4618868B2 (ja) * | 1999-11-15 | 2011-01-26 | 富士通テン株式会社 | ディジタル放送受信機及びセグメント数検出装置 |
US6993245B1 (en) | 1999-11-18 | 2006-01-31 | Vulcan Patents Llc | Iterative, maximally probable, batch-mode commercial detection for audiovisual content |
US6721488B1 (en) * | 1999-11-30 | 2004-04-13 | Koninklijke Philips Electronics N.V. | Method and apparatus to identify sequential content stored on a storage medium |
WO2001045103A1 (en) * | 1999-12-14 | 2001-06-21 | Koninklijke Philips Electronics N.V. | Method and apparatus to identify content stored on a storage medium |
US6397041B1 (en) | 1999-12-22 | 2002-05-28 | Radio Propagation Services, Inc. | Broadcast monitoring and control system |
US6757682B1 (en) | 2000-01-28 | 2004-06-29 | Interval Research Corporation | Alerting users to items of current interest |
US6675174B1 (en) | 2000-02-02 | 2004-01-06 | International Business Machines Corp. | System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams |
US6593976B1 (en) * | 2000-02-14 | 2003-07-15 | Koninklijke Philips Electronics N.V. | Automatic return to input source when user-selected content reappears in input source |
US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
US6834308B1 (en) | 2000-02-17 | 2004-12-21 | Audible Magic Corporation | Method and apparatus for identifying media content presented on a media playing device |
WO2001063916A1 (en) | 2000-02-25 | 2001-08-30 | Interval Research Corporation | Method and system for selecting advertisements |
US8910199B2 (en) * | 2000-02-25 | 2014-12-09 | Interval Licensing Llc | Targeted television content display |
US7661116B2 (en) | 2000-02-25 | 2010-02-09 | Vulcan Patents Llc | Auction for targeted content |
GB2360581A (en) * | 2000-03-15 | 2001-09-26 | Television Monitoring Services | Quantification of brand exposure on screen |
US20040255334A1 (en) * | 2000-03-28 | 2004-12-16 | Gotuit Audio, Inc. | Methods and apparatus for seamlessly changing volumes during playback using a compact disk changer |
US20060015925A1 (en) * | 2000-03-28 | 2006-01-19 | Gotuit Media Corp | Sales presentation video on demand system |
US6968564B1 (en) * | 2000-04-06 | 2005-11-22 | Nielsen Media Research, Inc. | Multi-band spectral audio encoding |
AU2001246797A1 (en) * | 2000-04-10 | 2001-10-23 | Contentwise Ltd. | Method and system for managing multimedia databases |
US7305104B2 (en) * | 2000-04-21 | 2007-12-04 | Digimarc Corporation | Authentication of identification documents using digital watermarks |
US20060217828A1 (en) * | 2002-10-23 | 2006-09-28 | Hicken Wendell T | Music searching system and method |
JP4300697B2 (ja) * | 2000-04-24 | 2009-07-22 | ソニー株式会社 | 信号処理装置及び方法 |
JP4507351B2 (ja) * | 2000-04-27 | 2010-07-21 | ソニー株式会社 | 信号処理装置及び方法 |
US8121843B2 (en) | 2000-05-02 | 2012-02-21 | Digimarc Corporation | Fingerprint methods and systems for media signals |
US7617509B1 (en) | 2000-06-23 | 2009-11-10 | International Business Machines Corporation | Method and system for automated monitoring of quality of service of digital video material distribution and play-out |
US8219545B2 (en) * | 2000-07-27 | 2012-07-10 | Goldhar/Jaffe Technology Development Corporation | Indigenous authentication and searching system and method |
US6757828B1 (en) * | 2000-07-27 | 2004-06-29 | Jonathan E. Jaffe | Indigenous authentication for sensor-recorders and other information capture devices |
US7853664B1 (en) | 2000-07-31 | 2010-12-14 | Landmark Digital Services Llc | Method and system for purchasing pre-recorded music |
JP3775186B2 (ja) | 2000-08-10 | 2006-05-17 | 日本電気株式会社 | 放送確認システム、放送確認装置および方法、放送確認プログラムを記録した記録媒体 |
US20020059629A1 (en) * | 2000-08-21 | 2002-05-16 | Markel Steven O. | Detection and recognition of data receiver to facilitate proper transmission of enhanced data |
MXPA02003991A (es) | 2000-08-23 | 2002-12-13 | Koninkl Philips Electronics Nv | Metodo de mejoramiento y traduccion de un articulo contenido, sistema de cliente y sistema de servidor. |
US20020057286A1 (en) * | 2000-08-25 | 2002-05-16 | Markel Steven O. | Device independent video enhancement scripting language |
US20020059588A1 (en) * | 2000-08-25 | 2002-05-16 | Thomas Huber | Personalized remote control |
US8205237B2 (en) | 2000-09-14 | 2012-06-19 | Cox Ingemar J | Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet |
WO2002035516A1 (fr) * | 2000-10-23 | 2002-05-02 | Ntt Communications Corporation | Systeme et procede de reconnaissance d'une composition musicale, support de stockage de programme de composition musicale, procede et systeme de reconnaissance commerciale, et support de stockage de programme de reconnaissance commerciale |
US7277766B1 (en) * | 2000-10-24 | 2007-10-02 | Moodlogic, Inc. | Method and system for analyzing digital audio files |
US6574594B2 (en) | 2000-11-03 | 2003-06-03 | International Business Machines Corporation | System for monitoring broadcast audio content |
US6748360B2 (en) | 2000-11-03 | 2004-06-08 | International Business Machines Corporation | System for selling a product utilizing audio content identification |
US7031921B2 (en) * | 2000-11-03 | 2006-04-18 | International Business Machines Corporation | System for monitoring audio content available over a network |
US7562012B1 (en) * | 2000-11-03 | 2009-07-14 | Audible Magic Corporation | Method and apparatus for creating a unique audio signature |
US6604072B2 (en) | 2000-11-03 | 2003-08-05 | International Business Machines Corporation | Feature-based audio content identification |
US7085613B2 (en) * | 2000-11-03 | 2006-08-01 | International Business Machines Corporation | System for monitoring audio content in a video broadcast |
US6999715B2 (en) * | 2000-12-11 | 2006-02-14 | Gary Alan Hayter | Broadcast audience surveillance using intercepted audio |
US20020072982A1 (en) | 2000-12-12 | 2002-06-13 | Shazam Entertainment Ltd. | Method and system for interacting with a user in an experiential environment |
US20020080976A1 (en) * | 2000-12-14 | 2002-06-27 | Schreer Scott P. | System and method for accessing authorized recordings |
US7266704B2 (en) | 2000-12-18 | 2007-09-04 | Digimarc Corporation | User-friendly rights management systems and methods |
WO2002051063A1 (en) | 2000-12-21 | 2002-06-27 | Digimarc Corporation | Methods, apparatus and programs for generating and utilizing content signatures |
US20020114299A1 (en) * | 2000-12-27 | 2002-08-22 | Daozheng Lu | Apparatus and method for measuring tuning of a digital broadcast receiver |
US8458754B2 (en) * | 2001-01-22 | 2013-06-04 | Sony Computer Entertainment Inc. | Method and system for providing instant start multimedia content |
US20070300258A1 (en) * | 2001-01-29 | 2007-12-27 | O'connor Daniel | Methods and systems for providing media assets over a network |
ATE405101T1 (de) * | 2001-02-12 | 2008-08-15 | Gracenote Inc | Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei |
US8909128B2 (en) * | 2008-04-09 | 2014-12-09 | 3D Radio Llc | Radio device with virtually infinite simultaneous inputs |
US8699995B2 (en) | 2008-04-09 | 2014-04-15 | 3D Radio Llc | Alternate user interfaces for multi tuner radio device |
US8868023B2 (en) | 2008-01-04 | 2014-10-21 | 3D Radio Llc | Digital radio systems and methods |
AU2002247173A1 (en) | 2001-02-20 | 2002-09-04 | Caron S. Ellis | Enhanced radio systems and methods |
US8706023B2 (en) * | 2008-01-04 | 2014-04-22 | 3D Radio Llc | Multi-tuner radio systems and methods |
US7359889B2 (en) | 2001-03-02 | 2008-04-15 | Landmark Digital Services Llc | Method and apparatus for automatically creating database for use in automated media recognition system |
AU2002250559A1 (en) | 2001-03-22 | 2002-10-08 | United Video Properties, Inc. | Personal video recorder systems and methods |
US8949878B2 (en) * | 2001-03-30 | 2015-02-03 | Funai Electric Co., Ltd. | System for parental control in video programs based on multimedia content information |
US7363278B2 (en) * | 2001-04-05 | 2008-04-22 | Audible Magic Corporation | Copyright detection and protection system and method |
US7248715B2 (en) * | 2001-04-06 | 2007-07-24 | Digimarc Corporation | Digitally watermarking physical media |
US7039585B2 (en) | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
US7046819B2 (en) | 2001-04-25 | 2006-05-16 | Digimarc Corporation | Encoded reference signal for digital watermarks |
US7325249B2 (en) * | 2001-04-30 | 2008-01-29 | Aol Llc | Identifying unwanted electronic messages |
US6785656B2 (en) * | 2001-06-05 | 2004-08-31 | Xm Satellite Radio, Inc. | Method and apparatus for digital audio playback using local stored content |
US20050005308A1 (en) * | 2002-01-29 | 2005-01-06 | Gotuit Video, Inc. | Methods and apparatus for recording and replaying sports broadcasts |
US6963543B2 (en) | 2001-06-29 | 2005-11-08 | Qualcomm Incorporated | Method and system for group call service |
US8572640B2 (en) * | 2001-06-29 | 2013-10-29 | Arbitron Inc. | Media data use measurement with remote decoding/pattern matching |
US7529659B2 (en) | 2005-09-28 | 2009-05-05 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
US6968337B2 (en) * | 2001-07-10 | 2005-11-22 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
US7877438B2 (en) * | 2001-07-20 | 2011-01-25 | Audible Magic Corporation | Method and apparatus for identifying new media content |
WO2003009277A2 (en) * | 2001-07-20 | 2003-01-30 | Gracenote, Inc. | Automatic identification of sound recordings |
US8972481B2 (en) | 2001-07-20 | 2015-03-03 | Audible Magic, Inc. | Playlist generation method and apparatus |
US20030054757A1 (en) * | 2001-09-19 | 2003-03-20 | Kolessar Ronald S. | Monitoring usage of media data with non-program data elimination |
US20030070179A1 (en) * | 2001-10-04 | 2003-04-10 | Ritz Peter B. | System and method for connecting end user with application based on broadcast code |
US6961467B2 (en) * | 2001-10-17 | 2005-11-01 | Intel Corporation | Identifying image content |
US20030135623A1 (en) * | 2001-10-23 | 2003-07-17 | Audible Magic, Inc. | Method and apparatus for cache promotion |
US7012653B1 (en) * | 2001-11-30 | 2006-03-14 | Bellsouth Intellectual Property Corporation | Program restart and commercial ending notification method and system |
US7496604B2 (en) | 2001-12-03 | 2009-02-24 | Aol Llc | Reducing duplication of files on a network |
US7870089B1 (en) * | 2001-12-03 | 2011-01-11 | Aol Inc. | Reducing duplication of embedded resources on a network |
US20030110500A1 (en) * | 2001-12-06 | 2003-06-12 | Rodriguez Arturo A. | Prediction-based adaptative control of television viewing functionality |
US7120922B2 (en) * | 2001-12-11 | 2006-10-10 | Scientific-Atlanta, Inc. | Time-adaptive control of television viewing functionality |
US9967633B1 (en) | 2001-12-14 | 2018-05-08 | At&T Intellectual Property I, L.P. | System and method for utilizing television viewing patterns |
US20110178877A1 (en) | 2001-12-14 | 2011-07-21 | Swix Scott R | Advertising and content management systems and methods |
US7212979B1 (en) | 2001-12-14 | 2007-05-01 | Bellsouth Intellectuall Property Corporation | System and method for identifying desirable subscribers |
US7064796B2 (en) * | 2001-12-21 | 2006-06-20 | Eloda Inc. | Method and system for re-identifying broadcast segments using statistical profiles |
US7086075B2 (en) | 2001-12-21 | 2006-08-01 | Bellsouth Intellectual Property Corporation | Method and system for managing timed responses to A/V events in television programming |
US8086491B1 (en) | 2001-12-31 | 2011-12-27 | At&T Intellectual Property I, L. P. | Method and system for targeted content distribution using tagged data streams |
US7337455B2 (en) * | 2001-12-31 | 2008-02-26 | Koninklijke Philips Electronics N.V. | Method, apparatus, and program for evolving algorithms for detecting content in information streams |
US20030131350A1 (en) | 2002-01-08 | 2003-07-10 | Peiffer John C. | Method and apparatus for identifying a digital audio signal |
AU2003210625A1 (en) | 2002-01-22 | 2003-09-02 | Digimarc Corporation | Digital watermarking and fingerprinting including symchronization, layering, version control, and compressed embedding |
US20070113250A1 (en) * | 2002-01-29 | 2007-05-17 | Logan James D | On demand fantasy sports systems and methods |
US7477739B2 (en) | 2002-02-05 | 2009-01-13 | Gracenote, Inc. | Efficient storage of fingerprints |
US8150235B2 (en) * | 2002-02-08 | 2012-04-03 | Intel Corporation | Method of home media server control |
US20030154493A1 (en) * | 2002-02-14 | 2003-08-14 | Kagle Jonathan C. | Identifying unique broadcasts |
US6766523B2 (en) | 2002-05-31 | 2004-07-20 | Microsoft Corporation | System and method for identifying and segmenting repeating media objects embedded in a stream |
US7461392B2 (en) * | 2002-07-01 | 2008-12-02 | Microsoft Corporation | System and method for identifying and segmenting repeating media objects embedded in a stream |
US8601504B2 (en) * | 2002-06-20 | 2013-12-03 | Verance Corporation | Secure tracking system and method for video program content |
AU2003280513A1 (en) * | 2002-07-01 | 2004-01-19 | Microsoft Corporation | A system and method for providing user control over repeating objects embedded in a stream |
US20040091111A1 (en) * | 2002-07-16 | 2004-05-13 | Levy Kenneth L. | Digital watermarking and fingerprinting applications |
US20040013405A1 (en) * | 2002-07-18 | 2004-01-22 | Christiansen Robert D | Method for preparing/printing video scene indices |
US8176508B2 (en) * | 2002-08-02 | 2012-05-08 | Time Warner Cable | Method and apparatus to provide verification of data using a fingerprint |
SE524162C2 (sv) * | 2002-08-23 | 2004-07-06 | Rickard Berg | Förfarande för att behandla signaler |
US20060129822A1 (en) * | 2002-08-26 | 2006-06-15 | Koninklijke Philips Electronics, N.V. | Method of content identification, device, and software |
EP1403783A3 (en) * | 2002-09-24 | 2005-01-19 | Matsushita Electric Industrial Co., Ltd. | Audio signal feature extraction |
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
US9711153B2 (en) * | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
US7222071B2 (en) | 2002-09-27 | 2007-05-22 | Arbitron Inc. | Audio data receipt/exposure measurement with code monitoring and signature extraction |
US20040062520A1 (en) * | 2002-09-27 | 2004-04-01 | Koninklijke Philips Electronics N.V. | Enhanced commercial detection through fusion of video and audio signatures |
FR2845179B1 (fr) * | 2002-09-27 | 2004-11-05 | Thomson Licensing Sa | Procede de regroupement d'images d'une sequence video |
JP2006501498A (ja) * | 2002-09-30 | 2006-01-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 指紋抽出 |
EP2782337A3 (en) | 2002-10-15 | 2014-11-26 | Verance Corporation | Media monitoring, management and information system |
WO2004038538A2 (en) | 2002-10-23 | 2004-05-06 | Nielsen Media Research, Inc. | Digital data insertion apparatus and methods for use with compressed audio/video data |
KR20050086470A (ko) * | 2002-11-12 | 2005-08-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 멀티미디어 컨텐츠를 핑거프린트하는 방법 |
JP4218319B2 (ja) * | 2002-11-19 | 2009-02-04 | 日本電気株式会社 | 映像閲覧システムおよび方法 |
JP4228662B2 (ja) * | 2002-11-19 | 2009-02-25 | 日本電気株式会社 | 映像閲覧システムおよび方法 |
US8204353B2 (en) * | 2002-11-27 | 2012-06-19 | The Nielsen Company (Us), Llc | Apparatus and methods for tracking and analyzing digital recording device event sequences |
AU2003283783A1 (en) * | 2002-12-20 | 2005-05-11 | Koninklijke Philips Electronics N.V. | Video content detection |
US7483835B2 (en) * | 2002-12-23 | 2009-01-27 | Arbitron, Inc. | AD detection using ID code and extracted signature |
CN1735887B (zh) * | 2003-01-06 | 2010-04-28 | 皇家飞利浦电子股份有限公司 | 用于相似视频内容跳转的方法和设备 |
US20040153647A1 (en) * | 2003-01-31 | 2004-08-05 | Rotholtz Ben Aaron | Method and process for transmitting video content |
US8332326B2 (en) * | 2003-02-01 | 2012-12-11 | Audible Magic Corporation | Method and apparatus to identify a work received by a processing system |
EP1593217A4 (en) | 2003-02-10 | 2009-04-01 | Nielsen Media Res Inc | METHOD AND DEVICE FOR ADAPTIVELY COLLECTING INVESTIGATOR INFORMATION DATA |
US7509550B2 (en) * | 2003-02-13 | 2009-03-24 | Janusz Rajski | Fault diagnosis of compressed test responses |
US7437640B2 (en) * | 2003-02-13 | 2008-10-14 | Janusz Rajski | Fault diagnosis of compressed test responses having one or more unknown states |
ATE532133T1 (de) * | 2003-02-13 | 2011-11-15 | Mentor Graphics Corp | Komprimieren von testantworten unter verwendung eines kompaktors |
JP3901106B2 (ja) * | 2003-02-19 | 2007-04-04 | ソニー株式会社 | 受信装置およびその設定方法 |
US20040237102A1 (en) * | 2003-03-07 | 2004-11-25 | Richard Konig | Advertisement substitution |
US20050149968A1 (en) * | 2003-03-07 | 2005-07-07 | Richard Konig | Ending advertisement insertion |
US20050177847A1 (en) * | 2003-03-07 | 2005-08-11 | Richard Konig | Determining channel associated with video stream |
US7738704B2 (en) * | 2003-03-07 | 2010-06-15 | Technology, Patents And Licensing, Inc. | Detecting known video entities utilizing fingerprints |
US7809154B2 (en) | 2003-03-07 | 2010-10-05 | Technology, Patents & Licensing, Inc. | Video entity recognition in compressed digital video streams |
US7694318B2 (en) * | 2003-03-07 | 2010-04-06 | Technology, Patents & Licensing, Inc. | Video detection and insertion |
US7320009B1 (en) | 2003-03-28 | 2008-01-15 | Novell, Inc. | Methods and systems for file replication utilizing differences between versions of files |
US20040226035A1 (en) * | 2003-05-05 | 2004-11-11 | Hauser David L. | Method and apparatus for detecting media content |
US7590695B2 (en) | 2003-05-09 | 2009-09-15 | Aol Llc | Managing electronic messages |
US7509180B2 (en) * | 2003-05-23 | 2009-03-24 | Microsoft Corporation | Extending digital rights management and authentication to audio speakers |
US7289533B2 (en) * | 2003-06-06 | 2007-10-30 | Quake Global, Inc. | Universal subscriber communicator module |
US20040260682A1 (en) * | 2003-06-19 | 2004-12-23 | Microsoft Corporation | System and method for identifying content and managing information corresponding to objects in a signal |
CA2530012C (en) * | 2003-06-20 | 2012-04-03 | Nielsen Media Research, Inc. | Signature-based program identification apparatus and methods for use with digital broadcast systems |
US7739602B2 (en) | 2003-06-24 | 2010-06-15 | Aol Inc. | System and method for community centric resource sharing based on a publishing subscription model |
US7386047B2 (en) * | 2003-08-19 | 2008-06-10 | Radio Computing Services, Inc. | Method for determining the likelihood of a match between source data and reference data |
JP3885786B2 (ja) * | 2003-09-12 | 2007-02-28 | ソニー株式会社 | 情報信号の処理装置および処理方法、並びにその処理方法を実行させるためのプログラム |
CA2540575C (en) | 2003-09-12 | 2013-12-17 | Kevin Deng | Digital video signature apparatus and methods for use with video program identification systems |
US20070124770A1 (en) * | 2003-09-25 | 2007-05-31 | Koninklijke Philips Electronics N.V. | Simple program guide |
US20070039018A1 (en) * | 2005-08-09 | 2007-02-15 | Verance Corporation | Apparatus, systems and methods for broadcast advertising stewardship |
US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
US7369677B2 (en) | 2005-04-26 | 2008-05-06 | Verance Corporation | System reactions to the detection of embedded watermarks in a digital host content |
US9055239B2 (en) | 2003-10-08 | 2015-06-09 | Verance Corporation | Signal continuity assessment using embedded watermarks |
US7788696B2 (en) * | 2003-10-15 | 2010-08-31 | Microsoft Corporation | Inferring information about media stream objects |
WO2005041109A2 (en) * | 2003-10-17 | 2005-05-06 | Nielsen Media Research, Inc. | Methods and apparatus for identifiying audio/video content using temporal signal characteristics |
US8239446B2 (en) * | 2003-11-19 | 2012-08-07 | Sony Computer Entertainment America Llc | Content distribution architecture |
US20050108754A1 (en) * | 2003-11-19 | 2005-05-19 | Serenade Systems | Personalized content application |
AU2005215786A1 (en) | 2004-02-17 | 2005-09-01 | Nielsen Media Research, Inc. Et Al. | Methods and apparatus for monitoring video games |
MXPA06009614A (es) | 2004-02-26 | 2007-02-22 | Mediaguide Inc | Metodo y aparato para deteccion e identificacion automaticas de difusion de senal de programacion de audio o video. |
US8229751B2 (en) * | 2004-02-26 | 2012-07-24 | Mediaguide, Inc. | Method and apparatus for automatic detection and identification of unidentified Broadcast audio or video signals |
US20050193426A1 (en) * | 2004-02-27 | 2005-09-01 | Raja Neogi | System and method to control fingerprint processing in a media network |
US7483975B2 (en) * | 2004-03-26 | 2009-01-27 | Arbitron, Inc. | Systems and methods for gathering data concerning usage of media data |
US8738763B2 (en) | 2004-03-26 | 2014-05-27 | The Nielsen Company (Us), Llc | Research data gathering with a portable monitor and a stationary device |
US8688248B2 (en) * | 2004-04-19 | 2014-04-01 | Shazam Investments Limited | Method and system for content sampling and identification |
US7793319B2 (en) * | 2004-04-27 | 2010-09-07 | Gateway, Inc. | System and method for improved channel surfing |
US20050267750A1 (en) * | 2004-05-27 | 2005-12-01 | Anonymous Media, Llc | Media usage monitoring and measurement system and method |
US20150051967A1 (en) | 2004-05-27 | 2015-02-19 | Anonymous Media Research, Llc | Media usage monitoring and measurment system and method |
CN1934650A (zh) * | 2004-06-18 | 2007-03-21 | 松下电器产业株式会社 | Av内容处理设备、av内容处理方法、av内容处理程序及av处理设备中使用的集成电路 |
CN1993909A (zh) * | 2004-07-02 | 2007-07-04 | 尼尔逊媒介研究股份有限公司 | 用于识别与数字媒体设备相关联的收视信息的方法和装置 |
CA2574998C (en) | 2004-07-23 | 2011-03-15 | Nielsen Media Research, Inc. | Methods and apparatus for monitoring the insertion of local media content into a program stream |
US8130746B2 (en) | 2004-07-28 | 2012-03-06 | Audible Magic Corporation | System for distributing decoy content in a peer to peer network |
US8977250B2 (en) * | 2004-08-27 | 2015-03-10 | The Invention Science Fund I, Llc | Context-aware filter for participants in persistent communication |
US9779750B2 (en) * | 2004-07-30 | 2017-10-03 | Invention Science Fund I, Llc | Cue-aware privacy filter for participants in persistent communications |
US9704502B2 (en) * | 2004-07-30 | 2017-07-11 | Invention Science Fund I, Llc | Cue-aware privacy filter for participants in persistent communications |
US8521828B2 (en) | 2004-07-30 | 2013-08-27 | The Invention Science Fund I, Llc | Themes indicative of participants in persistent communication |
US20080092031A1 (en) * | 2004-07-30 | 2008-04-17 | Steven John Simske | Rich media printer |
US20060212149A1 (en) * | 2004-08-13 | 2006-09-21 | Hicken Wendell T | Distributed system and method for intelligent data analysis |
MX2007002071A (es) * | 2004-08-18 | 2007-04-24 | Nielsen Media Res Inc | Metodos y aparatos para generar firmas. |
US7386542B2 (en) * | 2004-08-30 | 2008-06-10 | The Mitre Corporation | Personalized broadcast news navigator |
US7826708B2 (en) * | 2004-11-02 | 2010-11-02 | Microsoft Corporation | System and method for automatically customizing a buffered media stream |
EP3591864B1 (en) * | 2004-11-22 | 2022-04-27 | Nielsen Media Research, Inc. | Apparatus and method to identify a media time shift |
US20060155754A1 (en) * | 2004-12-08 | 2006-07-13 | Steven Lubin | Playlist driven automated content transmission and delivery system |
US7567899B2 (en) * | 2004-12-30 | 2009-07-28 | All Media Guide, Llc | Methods and apparatus for audio recognition |
US20060167458A1 (en) * | 2005-01-25 | 2006-07-27 | Lorenz Gabele | Lock and release mechanism for a sternal clamp |
GB0502844D0 (en) * | 2005-02-11 | 2005-03-16 | Univ Edinburgh | Storing digital content for access using a captured image |
US20060195860A1 (en) * | 2005-02-25 | 2006-08-31 | Eldering Charles A | Acting on known video entities detected utilizing fingerprinting |
GB2423881B (en) * | 2005-03-01 | 2011-03-09 | Half Minute Media Ltd | Detecting known video entities taking into account regions of disinterest |
GB2423882A (en) * | 2005-03-01 | 2006-09-06 | Half Minute Media Ltd | Acting on known video entities detected utilizing fingerprinting |
JP2008532200A (ja) * | 2005-03-04 | 2008-08-14 | ミュージックアイピー コーポレイション | 再生リストを作成するためのスキャンシャッフル |
US20060242667A1 (en) * | 2005-04-22 | 2006-10-26 | Petersen Erin L | Ad monitoring and indication |
US7690011B2 (en) | 2005-05-02 | 2010-03-30 | Technology, Patents & Licensing, Inc. | Video stream modification to defeat detection |
US7613736B2 (en) * | 2005-05-23 | 2009-11-03 | Resonance Media Services, Inc. | Sharing music essence in a recommendation system |
US20060271947A1 (en) * | 2005-05-23 | 2006-11-30 | Lienhart Rainer W | Creating fingerprints |
US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
US8781967B2 (en) | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
US8577684B2 (en) | 2005-07-13 | 2013-11-05 | Intellisist, Inc. | Selective security masking within recorded speech utilizing speech recognition techniques |
US8665868B2 (en) * | 2005-08-19 | 2014-03-04 | Cpacket Networks, Inc. | Apparatus and method for enhancing forwarding and classification of network traffic with prioritized matching and categorization |
US8296846B2 (en) * | 2005-08-19 | 2012-10-23 | Cpacket Networks, Inc. | Apparatus and method for associating categorization information with network traffic to facilitate application level processing |
US8024799B2 (en) * | 2005-08-19 | 2011-09-20 | Cpacket Networks, Inc. | Apparatus and method for facilitating network security with granular traffic modifications |
US20070106405A1 (en) * | 2005-08-19 | 2007-05-10 | Gracenote, Inc. | Method and system to provide reference data for identification of digital content |
US7937756B2 (en) * | 2005-08-19 | 2011-05-03 | Cpacket Networks, Inc. | Apparatus and method for facilitating network security |
US8346918B2 (en) * | 2005-08-19 | 2013-01-01 | Cpacket Networks, Inc. | Apparatus and method for biased and weighted sampling of network traffic to facilitate network monitoring |
US7882554B2 (en) * | 2005-08-19 | 2011-02-01 | Cpacket Networks, Inc. | Apparatus and method for selective mirroring |
US7890991B2 (en) | 2005-08-19 | 2011-02-15 | Cpacket Networks, Inc. | Apparatus and method for providing security and monitoring in a networking architecture |
US7698008B2 (en) * | 2005-09-08 | 2010-04-13 | Apple Inc. | Content-based audio comparisons |
US8594429B2 (en) * | 2005-10-11 | 2013-11-26 | Hewlett-Packard Development Company, L.P. | Method and apparatus for processing a video stream |
EP1949579B1 (en) * | 2005-10-21 | 2010-08-18 | Nielsen Media Research, Inc. | Personal People Meter PPM in the headset of a MP3 portable media player. |
US10776585B2 (en) | 2005-10-26 | 2020-09-15 | Cortica, Ltd. | System and method for recognizing characters in multimedia content |
US10372746B2 (en) | 2005-10-26 | 2019-08-06 | Cortica, Ltd. | System and method for searching applications using multimedia content elements |
US8818916B2 (en) | 2005-10-26 | 2014-08-26 | Cortica, Ltd. | System and method for linking multimedia data elements to web pages |
US10607355B2 (en) * | 2005-10-26 | 2020-03-31 | Cortica, Ltd. | Method and system for determining the dimensions of an object shown in a multimedia content item |
US10621988B2 (en) | 2005-10-26 | 2020-04-14 | Cortica Ltd | System and method for speech to text translation using cores of a natural liquid architecture system |
US11032017B2 (en) | 2005-10-26 | 2021-06-08 | Cortica, Ltd. | System and method for identifying the context of multimedia content elements |
US11003706B2 (en) | 2005-10-26 | 2021-05-11 | Cortica Ltd | System and methods for determining access permissions on personalized clusters of multimedia content elements |
US10742340B2 (en) | 2005-10-26 | 2020-08-11 | Cortica Ltd. | System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto |
US10691642B2 (en) | 2005-10-26 | 2020-06-23 | Cortica Ltd | System and method for enriching a concept database with homogenous concepts |
US11019161B2 (en) | 2005-10-26 | 2021-05-25 | Cortica, Ltd. | System and method for profiling users interest based on multimedia content analysis |
US8326775B2 (en) | 2005-10-26 | 2012-12-04 | Cortica Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
US11216498B2 (en) | 2005-10-26 | 2022-01-04 | Cortica, Ltd. | System and method for generating signatures to three-dimensional multimedia data elements |
US10614626B2 (en) | 2005-10-26 | 2020-04-07 | Cortica Ltd. | System and method for providing augmented reality challenges |
US10585934B2 (en) | 2005-10-26 | 2020-03-10 | Cortica Ltd. | Method and system for populating a concept database with respect to user identifiers |
US11403336B2 (en) | 2005-10-26 | 2022-08-02 | Cortica Ltd. | System and method for removing contextually identical multimedia content elements |
ES2386977T3 (es) * | 2005-11-29 | 2012-09-10 | Google Inc. | Aplicaciones sociales e interactivas para medios masivos |
CN101371472B (zh) * | 2005-12-12 | 2017-04-19 | 尼尔逊媒介研究股份有限公司 | 对声音/视觉装置进行无线计量的系统和方法 |
US9015740B2 (en) | 2005-12-12 | 2015-04-21 | The Nielsen Company (Us), Llc | Systems and methods to wirelessly meter audio/visual devices |
US20070288476A1 (en) * | 2005-12-20 | 2007-12-13 | Flanagan Eugene L Iii | Methods and systems for conducting research operations |
US7627878B2 (en) * | 2005-12-23 | 2009-12-01 | Eloda Inc. | Method and System for automated auditing of advertising |
US20070149114A1 (en) * | 2005-12-28 | 2007-06-28 | Andrey Danilenko | Capture, storage and retrieval of broadcast information while on-the-go |
US20090006337A1 (en) * | 2005-12-30 | 2009-01-01 | Mediaguide, Inc. | Method and apparatus for automatic detection and identification of unidentified video signals |
PT1826932E (pt) * | 2006-02-22 | 2011-10-03 | Media Evolution Technologies Inc | Método e dispositivo para a geração de assinaturas áudio digitais |
EP2011002B1 (en) | 2006-03-27 | 2016-06-22 | Nielsen Media Research, Inc. | Methods and systems to meter media content presented on a wireless communication device |
US7735101B2 (en) | 2006-03-28 | 2010-06-08 | Cisco Technology, Inc. | System allowing users to embed comments at specific points in time into media presentation |
MX2007015979A (es) | 2006-03-31 | 2009-04-07 | Nielsen Media Res Inc | Metodos, sistemas y aparato para medicion de multiples fines. |
US20080036917A1 (en) * | 2006-04-07 | 2008-02-14 | Mark Pascarella | Methods and systems for generating and delivering navigatable composite videos |
CN101536503B (zh) | 2006-06-15 | 2012-09-26 | 尼尔森(美国)有限公司 | 利用隐藏字幕信息来计量内容曝光的方法和装置 |
US8019162B2 (en) * | 2006-06-20 | 2011-09-13 | The Nielsen Company (Us), Llc | Methods and apparatus for detecting on-screen media sources |
WO2007148264A1 (en) * | 2006-06-20 | 2007-12-27 | Koninklijke Philips Electronics N.V. | Generating fingerprints of video signals |
US8433915B2 (en) | 2006-06-28 | 2013-04-30 | Intellisist, Inc. | Selective security masking within recorded speech |
WO2008008915A2 (en) | 2006-07-12 | 2008-01-17 | Arbitron Inc. | Methods and systems for compliance confirmation and incentives |
DE102006032543A1 (de) * | 2006-07-13 | 2008-01-17 | Nokia Siemens Networks Gmbh & Co.Kg | Verfahren und System zur Reduzierung des Empfangs unerwünschter Nachrichten |
US7881547B2 (en) * | 2006-07-28 | 2011-02-01 | Genesis Microchip Inc. | Video window detector |
US9398350B1 (en) * | 2006-08-08 | 2016-07-19 | CastTV Inc. | Video matching service to offline counterpart |
US8745684B1 (en) | 2006-08-08 | 2014-06-03 | CastTV Inc. | Facilitating video search |
US7693872B2 (en) * | 2006-08-17 | 2010-04-06 | Anchorfree, Inc. | Software web crowler and method therefor |
US20080051029A1 (en) * | 2006-08-25 | 2008-02-28 | Bradley James Witteman | Phone-based broadcast audio identification |
CN101548294B (zh) | 2006-11-30 | 2012-06-27 | 杜比实验室特许公司 | 提取视频和音频信号内容的特征以提供信号的可靠识别 |
US20080155627A1 (en) * | 2006-12-04 | 2008-06-26 | O'connor Daniel | Systems and methods of searching for and presenting video and audio |
US20080147497A1 (en) * | 2006-12-13 | 2008-06-19 | Tischer Steven N | Advertising and content management systems and methods |
US10885543B1 (en) | 2006-12-29 | 2021-01-05 | The Nielsen Company (Us), Llc | Systems and methods to pre-scale media content to facilitate audience measurement |
CA2676516C (en) * | 2007-01-25 | 2020-02-04 | Arbitron, Inc. | Research data gathering |
US8453170B2 (en) * | 2007-02-27 | 2013-05-28 | Landmark Digital Services Llc | System and method for monitoring and recognizing broadcast data |
US8645987B2 (en) * | 2007-04-13 | 2014-02-04 | Power-Link Software Systems, Inc. | Advertisement airing audit system and associated methods |
US10489795B2 (en) | 2007-04-23 | 2019-11-26 | The Nielsen Company (Us), Llc | Determining relative effectiveness of media content items |
US20080274687A1 (en) | 2007-05-02 | 2008-11-06 | Roberts Dale T | Dynamic mixed media package |
US7912894B2 (en) | 2007-05-15 | 2011-03-22 | Adams Phillip M | Computerized, copy-detection and discrimination apparatus and method |
US8849432B2 (en) * | 2007-05-31 | 2014-09-30 | Adobe Systems Incorporated | Acoustic pattern identification using spectral characteristics to synchronize audio and/or video |
JP2008306549A (ja) * | 2007-06-08 | 2008-12-18 | Canon Inc | 無線制御局、及び無線端末局の制御方法、当該制御方法をコンピュータに実行させるためのコンピュータプログラム |
US8559516B2 (en) * | 2007-06-14 | 2013-10-15 | Sony Corporation | Video sequence ID by decimated scene signature |
US8006314B2 (en) | 2007-07-27 | 2011-08-23 | Audible Magic Corporation | System for identifying content of digital data |
US9483405B2 (en) | 2007-09-20 | 2016-11-01 | Sony Interactive Entertainment Inc. | Simplified run-time program translation for emulating complex processor pipelines |
EP2073460A1 (en) * | 2007-12-17 | 2009-06-24 | Alcatel Lucent | Method for forwarding packets, a related packet forwarding system, a related classification device and a related popularity monitoring device |
US20090165049A1 (en) | 2007-12-19 | 2009-06-25 | United Video Properties, Inc. | Methods and devices for presenting and interactive media guidance application |
US8285718B1 (en) * | 2007-12-21 | 2012-10-09 | CastTV Inc. | Clustering multimedia search |
WO2009088477A1 (en) | 2007-12-31 | 2009-07-16 | Arbitron, Inc. | Survey data acquisition |
US8930003B2 (en) * | 2007-12-31 | 2015-01-06 | The Nielsen Company (Us), Llc | Data capture bridge |
CA2660674A1 (en) * | 2008-03-27 | 2009-09-27 | Crim (Centre De Recherche Informatique De Montreal) | Media detection using acoustic recognition |
US8503991B2 (en) * | 2008-04-03 | 2013-08-06 | The Nielsen Company (Us), Llc | Methods and apparatus to monitor mobile devices |
US8245262B2 (en) * | 2008-04-07 | 2012-08-14 | Samsung Electronics Co., Ltd. | System and method for synchronization of television signals associated with multiple broadcast networks |
US8805689B2 (en) * | 2008-04-11 | 2014-08-12 | The Nielsen Company (Us), Llc | Methods and apparatus to generate and use content-aware watermarks |
US8947207B2 (en) | 2008-04-29 | 2015-02-03 | Quake Global, Inc. | Method and apparatus for a deployable radio-frequency identification portal system |
US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
WO2010022303A1 (en) | 2008-08-22 | 2010-02-25 | Dolby Laboratories Licensing Corporation | Content identification and quality monitoring |
WO2010027847A1 (en) * | 2008-08-26 | 2010-03-11 | Dolby Laboratories Licensing Corporation | Robust media fingerprints |
US7730061B2 (en) * | 2008-09-12 | 2010-06-01 | International Business Machines Corporation | Fast-approximate TFIDF |
US8108887B2 (en) * | 2008-10-30 | 2012-01-31 | The Nielsen Company (Us), Llc | Methods and apparatus for identifying media content using temporal signal characteristics |
US9124769B2 (en) | 2008-10-31 | 2015-09-01 | The Nielsen Company (Us), Llc | Methods and apparatus to verify presentation of media content |
US10567823B2 (en) | 2008-11-26 | 2020-02-18 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US9026668B2 (en) | 2012-05-26 | 2015-05-05 | Free Stream Media Corp. | Real-time and retargeted advertising on multiple screens of a user watching television |
US10631068B2 (en) | 2008-11-26 | 2020-04-21 | Free Stream Media Corp. | Content exposure attribution based on renderings of related content across multiple devices |
US8180891B1 (en) | 2008-11-26 | 2012-05-15 | Free Stream Media Corp. | Discovery, access control, and communication with networked services from within a security sandbox |
US9961388B2 (en) | 2008-11-26 | 2018-05-01 | David Harrison | Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements |
US9519772B2 (en) | 2008-11-26 | 2016-12-13 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US10977693B2 (en) | 2008-11-26 | 2021-04-13 | Free Stream Media Corp. | Association of content identifier of audio-visual data with additional data through capture infrastructure |
US10880340B2 (en) | 2008-11-26 | 2020-12-29 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US10419541B2 (en) | 2008-11-26 | 2019-09-17 | Free Stream Media Corp. | Remotely control devices over a network without authentication or registration |
US10334324B2 (en) | 2008-11-26 | 2019-06-25 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US9154942B2 (en) | 2008-11-26 | 2015-10-06 | Free Stream Media Corp. | Zero configuration communication between a browser and a networked media device |
US9986279B2 (en) | 2008-11-26 | 2018-05-29 | Free Stream Media Corp. | Discovery, access control, and communication with networked services |
US9386356B2 (en) | 2008-11-26 | 2016-07-05 | Free Stream Media Corp. | Targeting with television audience data across multiple screens |
US9390167B2 (en) | 2010-07-29 | 2016-07-12 | Soundhound, Inc. | System and methods for continuous audio matching |
NO331287B1 (no) * | 2008-12-15 | 2011-11-14 | Cisco Systems Int Sarl | Fremgangsmate og anordning for gjenkjenning av ansikter i en videostrom |
JP5045817B2 (ja) | 2009-01-23 | 2012-10-10 | 日本電気株式会社 | 画像識別子抽出装置 |
US8170341B2 (en) | 2009-01-23 | 2012-05-01 | Nec Corporation | Image signature extraction device |
US20110066437A1 (en) * | 2009-01-26 | 2011-03-17 | Robert Luff | Methods and apparatus to monitor media exposure using content-aware watermarks |
WO2010087124A1 (ja) | 2009-01-29 | 2010-08-05 | 日本電気株式会社 | 特徴量選択装置 |
EP2406903A4 (en) | 2009-03-11 | 2013-01-16 | Ravosh Samari | DIGITAL SIGNATURES |
EP2407932B1 (en) * | 2009-03-13 | 2019-11-27 | Nec Corporation | Image identifier extraction device |
US10133956B2 (en) | 2009-03-13 | 2018-11-20 | Nec Corporation | Image signature extraction device |
JP4735783B2 (ja) * | 2009-03-13 | 2011-07-27 | 日本電気株式会社 | 画像識別子照合装置 |
US8199651B1 (en) | 2009-03-16 | 2012-06-12 | Audible Magic Corporation | Method and system for modifying communication flows at a port level |
KR101355299B1 (ko) * | 2009-04-14 | 2014-01-23 | 닛본 덴끼 가부시끼가이샤 | 이미지 시그니처 추출 장치 |
US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
US10375451B2 (en) | 2009-05-29 | 2019-08-06 | Inscape Data, Inc. | Detection of common media segments |
US10949458B2 (en) | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
US10116972B2 (en) | 2009-05-29 | 2018-10-30 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
US8595781B2 (en) | 2009-05-29 | 2013-11-26 | Cognitive Media Networks, Inc. | Methods for identifying video segments and displaying contextual targeted content on a connected television |
US9071868B2 (en) * | 2009-05-29 | 2015-06-30 | Cognitive Networks, Inc. | Systems and methods for improving server and client performance in fingerprint ACR systems |
US8620967B2 (en) * | 2009-06-11 | 2013-12-31 | Rovi Technologies Corporation | Managing metadata for occurrences of a recording |
WO2010146786A1 (ja) | 2009-06-16 | 2010-12-23 | 日本電気株式会社 | 画像識別子照合装置 |
US20110041154A1 (en) * | 2009-08-14 | 2011-02-17 | All Media Guide, Llc | Content Recognition and Synchronization on a Television or Consumer Electronics Device |
US9264758B2 (en) * | 2009-09-14 | 2016-02-16 | Tivo Inc. | Method and an apparatus for detecting media content recordings |
US8677400B2 (en) * | 2009-09-30 | 2014-03-18 | United Video Properties, Inc. | Systems and methods for identifying audio content using an interactive media guidance application |
US20110078020A1 (en) * | 2009-09-30 | 2011-03-31 | Lajoie Dan | Systems and methods for identifying popular audio assets |
US8161071B2 (en) | 2009-09-30 | 2012-04-17 | United Video Properties, Inc. | Systems and methods for audio asset storage and management |
US8245249B2 (en) * | 2009-10-09 | 2012-08-14 | The Nielson Company (Us), Llc | Methods and apparatus to adjust signature matching results for audience measurement |
JP4786739B2 (ja) * | 2009-10-21 | 2011-10-05 | 株式会社東芝 | 情報処理装置および映像コンテンツデータ再生方法 |
US20110137976A1 (en) * | 2009-12-04 | 2011-06-09 | Bob Poniatowski | Multifunction Multimedia Device |
US8682145B2 (en) * | 2009-12-04 | 2014-03-25 | Tivo Inc. | Recording system based on multimedia content fingerprints |
US20110173185A1 (en) * | 2010-01-13 | 2011-07-14 | Rovi Technologies Corporation | Multi-stage lookup for rolling audio recognition |
US8886531B2 (en) * | 2010-01-13 | 2014-11-11 | Rovi Technologies Corporation | Apparatus and method for generating an audio fingerprint and using a two-stage query |
US9134875B2 (en) | 2010-03-23 | 2015-09-15 | VoteBlast, Inc. | Enhancing public opinion gathering and dissemination |
US8732605B1 (en) | 2010-03-23 | 2014-05-20 | VoteBlast, Inc. | Various methods and apparatuses for enhancing public opinion gathering and dissemination |
US9026034B2 (en) | 2010-05-04 | 2015-05-05 | Project Oda, Inc. | Automatic detection of broadcast programming |
CA2943957C (en) * | 2010-05-04 | 2017-10-03 | Avery Li-Chun Wang | Methods and systems for synchronizing media |
US8433759B2 (en) | 2010-05-24 | 2013-04-30 | Sony Computer Entertainment America Llc | Direction-conscious information sharing |
US9838753B2 (en) | 2013-12-23 | 2017-12-05 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US10192138B2 (en) | 2010-05-27 | 2019-01-29 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
US9047371B2 (en) | 2010-07-29 | 2015-06-02 | Soundhound, Inc. | System and method for matching a query against a broadcast stream |
WO2014134157A1 (en) | 2013-02-26 | 2014-09-04 | Quake Global, Inc. | Methods and apparatus for automatic identification wristband |
US10210160B2 (en) | 2010-09-07 | 2019-02-19 | Opentv, Inc. | Collecting data from different sources |
US9699503B2 (en) | 2010-09-07 | 2017-07-04 | Opentv, Inc. | Smart playlist |
US8949871B2 (en) | 2010-09-08 | 2015-02-03 | Opentv, Inc. | Smart media selection based on viewer user presence |
US8838977B2 (en) | 2010-09-16 | 2014-09-16 | Verance Corporation | Watermark extraction and content screening in a networked environment |
US20120084435A1 (en) * | 2010-10-04 | 2012-04-05 | International Business Machines Corporation | Smart Real-time Content Delivery |
US8955001B2 (en) | 2011-07-06 | 2015-02-10 | Symphony Advanced Media | Mobile remote media control platform apparatuses and methods |
US10142687B2 (en) | 2010-11-07 | 2018-11-27 | Symphony Advanced Media, Inc. | Audience content exposure monitoring apparatuses, methods and systems |
US9027051B2 (en) | 2010-12-31 | 2015-05-05 | Accenture Global Services Limited | Determining whether an advertisement aired in accordance with predefined airing specifications |
CN103348380B (zh) * | 2011-02-10 | 2016-08-10 | 日本电气株式会社 | 差异区域检测系统和差异区域检测方法 |
US9602870B2 (en) | 2011-03-31 | 2017-03-21 | Tvtak Ltd. | Devices, systems, methods, and media for detecting, indexing, and comparing video signals from a video display in a background scene using a camera-enabled device |
WO2012137654A1 (ja) * | 2011-04-05 | 2012-10-11 | ヤマハ株式会社 | 情報提供システム、識別情報解決サーバおよび携帯端末装置 |
US9035163B1 (en) | 2011-05-10 | 2015-05-19 | Soundbound, Inc. | System and method for targeting content based on identified audio and multimedia |
US8732739B2 (en) | 2011-07-18 | 2014-05-20 | Viggle Inc. | System and method for tracking and rewarding media and entertainment usage including substantially real time rewards |
US8861937B2 (en) | 2011-08-31 | 2014-10-14 | The Nielsen Company (Us), Llc | Methods and apparatus to access media |
US20130097007A1 (en) * | 2011-10-12 | 2013-04-18 | Joseph Brewer | Media posting system and method |
US9813310B1 (en) | 2011-10-31 | 2017-11-07 | Reality Analytics, Inc. | System and method for discriminating nature of communication traffic transmitted through network based on envelope characteristics |
US9973398B1 (en) | 2011-10-31 | 2018-05-15 | Reality Analytics, Inc. | System and method for discriminating remote site origination of communication signals transmitted through a network based on envelope characteristics |
US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US9696336B2 (en) | 2011-11-30 | 2017-07-04 | The Nielsen Company (Us), Llc | Multiple meter detection and processing using motion data |
US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
US8538333B2 (en) | 2011-12-16 | 2013-09-17 | Arbitron Inc. | Media exposure linking utilizing bluetooth signal characteristics |
US8977194B2 (en) | 2011-12-16 | 2015-03-10 | The Nielsen Company (Us), Llc | Media exposure and verification utilizing inductive coupling |
US20130262184A1 (en) * | 2012-03-30 | 2013-10-03 | Arbitron Inc. | Systems and Methods for Presence Detection and Linking to Media Exposure Data |
US8825188B2 (en) | 2012-06-04 | 2014-09-02 | Troy Christopher Stone | Methods and systems for identifying content types |
US9628829B2 (en) | 2012-06-26 | 2017-04-18 | Google Technology Holdings LLC | Identifying media on a mobile device |
US9118951B2 (en) | 2012-06-26 | 2015-08-25 | Arris Technology, Inc. | Time-synchronizing a parallel feed of secondary content with primary media content |
US10957310B1 (en) | 2012-07-23 | 2021-03-23 | Soundhound, Inc. | Integrated programming framework for speech and text understanding with meaning parsing |
US8989503B2 (en) * | 2012-08-03 | 2015-03-24 | Kodak Alaris Inc. | Identifying scene boundaries using group sparsity analysis |
US9282366B2 (en) | 2012-08-13 | 2016-03-08 | The Nielsen Company (Us), Llc | Methods and apparatus to communicate audience measurement information |
US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
US9058806B2 (en) | 2012-09-10 | 2015-06-16 | Cisco Technology, Inc. | Speaker segmentation and recognition based on list of speakers |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
US9106964B2 (en) | 2012-09-13 | 2015-08-11 | Verance Corporation | Enhanced content distribution using advertisements |
US9081778B2 (en) | 2012-09-25 | 2015-07-14 | Audible Magic Corporation | Using digital fingerprints to associate data with a work |
US9992729B2 (en) | 2012-10-22 | 2018-06-05 | The Nielsen Company (Us), Llc | Systems and methods for wirelessly modifying detection characteristics of portable devices |
US9106953B2 (en) | 2012-11-28 | 2015-08-11 | The Nielsen Company (Us), Llc | Media monitoring based on predictive signature caching |
CN104520719B (zh) | 2012-11-30 | 2017-12-08 | 尼尔森(美国)有限公司 | 使用运动数据的多计量检测和处理 |
US8886011B2 (en) | 2012-12-07 | 2014-11-11 | Cisco Technology, Inc. | System and method for question detection based video segmentation, search and collaboration in a video processing environment |
US9195649B2 (en) | 2012-12-21 | 2015-11-24 | The Nielsen Company (Us), Llc | Audio processing techniques for semantic audio recognition and report generation |
US9183849B2 (en) | 2012-12-21 | 2015-11-10 | The Nielsen Company (Us), Llc | Audio matching with semantic audio recognition and report generation |
US9158760B2 (en) | 2012-12-21 | 2015-10-13 | The Nielsen Company (Us), Llc | Audio decoding with supplemental semantic audio recognition and report generation |
US20140187268A1 (en) * | 2012-12-28 | 2014-07-03 | Arbitron Inc. | Apparatus, System and Method for Location Detection and User Identification for Media Exposure Data |
US9841492B2 (en) | 2013-02-25 | 2017-12-12 | Quake Global, Inc. | Ceiling-mounted RFID-enabled tracking |
US9819798B2 (en) | 2013-03-14 | 2017-11-14 | Intellisist, Inc. | Computer-implemented system and method for efficiently facilitating appointments within a call center via an automatic call distributor |
US9262794B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
US9325381B2 (en) | 2013-03-15 | 2016-04-26 | The Nielsen Company (Us), Llc | Methods, apparatus and articles of manufacture to monitor mobile devices |
US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
US9300991B2 (en) * | 2013-11-13 | 2016-03-29 | International Business Machines Corporation | Use of simultaneously received videos by a system to generate a quality of experience value |
US9507849B2 (en) | 2013-11-28 | 2016-11-29 | Soundhound, Inc. | Method for combining a query and a communication command in a natural language computer system |
US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US9426525B2 (en) | 2013-12-31 | 2016-08-23 | The Nielsen Company (Us), Llc. | Methods and apparatus to count people in an audience |
US9292488B2 (en) | 2014-02-01 | 2016-03-22 | Soundhound, Inc. | Method for embedding voice mail in a spoken utterance using a natural language processing computer system |
US11295730B1 (en) | 2014-02-27 | 2022-04-05 | Soundhound, Inc. | Using phonetic variants in a local context to improve natural language understanding |
CN106170988A (zh) | 2014-03-13 | 2016-11-30 | 凡瑞斯公司 | 使用嵌入式代码的交互式内容获取 |
US9699499B2 (en) | 2014-04-30 | 2017-07-04 | The Nielsen Company (Us), Llc | Methods and apparatus to measure exposure to streaming media |
US9564123B1 (en) | 2014-05-12 | 2017-02-07 | Soundhound, Inc. | Method and system for building an integrated user profile |
US9179184B1 (en) * | 2014-06-20 | 2015-11-03 | Google Inc. | Methods, systems, and media for detecting a presentation of media content on a display device |
US9641892B2 (en) | 2014-07-15 | 2017-05-02 | The Nielsen Company (Us), Llc | Frequency band selection and processing techniques for media source detection |
US9369780B2 (en) * | 2014-07-31 | 2016-06-14 | Verizon Patent And Licensing Inc. | Methods and systems for detecting one or more advertisement breaks in a media content stream |
US9729912B2 (en) * | 2014-09-22 | 2017-08-08 | Sony Corporation | Method, computer program, electronic device, and system |
CA2973740C (en) | 2015-01-30 | 2021-06-08 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
EP4375952A3 (en) | 2015-04-17 | 2024-06-19 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
US9653094B2 (en) | 2015-04-24 | 2017-05-16 | Cyber Resonance Corporation | Methods and systems for performing signal analysis to identify content types |
BR112018000801A2 (pt) | 2015-07-16 | 2018-09-04 | Inscape Data Inc | sistema, e método |
CA3216076A1 (en) | 2015-07-16 | 2017-01-19 | Inscape Data, Inc. | Detection of common media segments |
EP3323054A1 (en) | 2015-07-16 | 2018-05-23 | Inscape Data, Inc. | Prediction of future views of video segments to optimize system resource utilization |
US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
US10271107B2 (en) | 2015-11-26 | 2019-04-23 | The Nielsen Company (Us), Llc | Accelerated television advertisement identification |
US11195043B2 (en) | 2015-12-15 | 2021-12-07 | Cortica, Ltd. | System and method for determining common patterns in multimedia content elements based on key points |
WO2017105641A1 (en) | 2015-12-15 | 2017-06-22 | Cortica, Ltd. | Identification of key points in multimedia data elements |
DE102016204055B4 (de) * | 2016-03-11 | 2019-04-04 | Universität Ulm | Verfahren und Vorrichtung zur Erzeugung einer digitalen Signatur |
US10754978B2 (en) | 2016-07-29 | 2020-08-25 | Intellisist Inc. | Computer-implemented system and method for storing and retrieving sensitive information |
KR102690528B1 (ko) | 2017-04-06 | 2024-07-30 | 인스케이프 데이터, 인코포레이티드 | 미디어 시청 데이터를 사용하여 디바이스 맵의 정확도를 향상시키는 시스템 및 방법 |
WO2019008581A1 (en) | 2017-07-05 | 2019-01-10 | Cortica Ltd. | DETERMINATION OF DRIVING POLICIES |
US11899707B2 (en) | 2017-07-09 | 2024-02-13 | Cortica Ltd. | Driving policies determination |
FR3072807B1 (fr) | 2017-10-23 | 2021-05-07 | Hl2 Group | Procede et equipement de reconnaissance de detonation par filtrage selectif |
US10891971B2 (en) | 2018-06-04 | 2021-01-12 | The Nielsen Company (Us), Llc | Methods and apparatus to dynamically generate audio signatures adaptive to circumstances associated with media being monitored |
US10846544B2 (en) | 2018-07-16 | 2020-11-24 | Cartica Ai Ltd. | Transportation prediction system and method |
US10880023B2 (en) | 2018-08-03 | 2020-12-29 | Gracenote, Inc. | Vehicle-based media system with audio advertisement and external-device action synchronization feature |
US11275933B2 (en) * | 2018-08-24 | 2022-03-15 | Genpact Luxembourg S.Á R.L | Systems and methods for segmentation of report corpus using visual signatures |
US11181911B2 (en) | 2018-10-18 | 2021-11-23 | Cartica Ai Ltd | Control transfer of a vehicle |
US11126870B2 (en) | 2018-10-18 | 2021-09-21 | Cartica Ai Ltd. | Method and system for obstacle detection |
US10839694B2 (en) | 2018-10-18 | 2020-11-17 | Cartica Ai Ltd | Blind spot alert |
US20200133308A1 (en) | 2018-10-18 | 2020-04-30 | Cartica Ai Ltd | Vehicle to vehicle (v2v) communication less truck platooning |
US11270132B2 (en) | 2018-10-26 | 2022-03-08 | Cartica Ai Ltd | Vehicle to vehicle communication and signatures |
US10789535B2 (en) | 2018-11-26 | 2020-09-29 | Cartica Ai Ltd | Detection of road elements |
US11643005B2 (en) | 2019-02-27 | 2023-05-09 | Autobrains Technologies Ltd | Adjusting adjustable headlights of a vehicle |
US11285963B2 (en) | 2019-03-10 | 2022-03-29 | Cartica Ai Ltd. | Driver-based prediction of dangerous events |
US11694088B2 (en) | 2019-03-13 | 2023-07-04 | Cortica Ltd. | Method for object detection using knowledge distillation |
US11132548B2 (en) | 2019-03-20 | 2021-09-28 | Cortica Ltd. | Determining object information that does not explicitly appear in a media unit signature |
US12055408B2 (en) | 2019-03-28 | 2024-08-06 | Autobrains Technologies Ltd | Estimating a movement of a hybrid-behavior vehicle |
US11222069B2 (en) | 2019-03-31 | 2022-01-11 | Cortica Ltd. | Low-power calculation of a signature of a media unit |
US10776669B1 (en) | 2019-03-31 | 2020-09-15 | Cortica Ltd. | Signature generation and object detection that refer to rare scenes |
US11488290B2 (en) | 2019-03-31 | 2022-11-01 | Cortica Ltd. | Hybrid representation of a media unit |
US10789527B1 (en) | 2019-03-31 | 2020-09-29 | Cortica Ltd. | Method for object detection using shallow neural networks |
US10796444B1 (en) | 2019-03-31 | 2020-10-06 | Cortica Ltd | Configuring spanning elements of a signature generator |
US11593662B2 (en) | 2019-12-12 | 2023-02-28 | Autobrains Technologies Ltd | Unsupervised cluster generation |
US10748022B1 (en) | 2019-12-12 | 2020-08-18 | Cartica Ai Ltd | Crowd separation |
US11590988B2 (en) | 2020-03-19 | 2023-02-28 | Autobrains Technologies Ltd | Predictive turning assistant |
US11827215B2 (en) | 2020-03-31 | 2023-11-28 | AutoBrains Technologies Ltd. | Method for training a driving related object detector |
US11756424B2 (en) | 2020-07-24 | 2023-09-12 | AutoBrains Technologies Ltd. | Parking assist |
US12049116B2 (en) | 2020-09-30 | 2024-07-30 | Autobrains Technologies Ltd | Configuring an active suspension |
EP4194300A1 (en) | 2021-08-05 | 2023-06-14 | Autobrains Technologies LTD. | Providing a prediction of a radius of a motorcycle turn |
US20230206256A1 (en) * | 2021-12-29 | 2023-06-29 | The Nielsen Company (Us), Llc | Methods, systems, apparatus, and articles of manufacture to modify audience estimates to preserve logical consistency |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2766374A (en) * | 1951-07-25 | 1956-10-09 | Internat Telementer Corp | System and apparatus for determining popularity ratings of different transmitted programs |
US3919479A (en) * | 1972-09-21 | 1975-11-11 | First National Bank Of Boston | Broadcast signal identification system |
US4025851A (en) * | 1975-11-28 | 1977-05-24 | A.C. Nielsen Company | Automatic monitor for programs broadcast |
US4230990C1 (en) * | 1979-03-16 | 2002-04-09 | John G Lert Jr | Broadcast program identification method and system |
JPS58175157A (ja) * | 1982-04-06 | 1983-10-14 | Mitsubishi Electric Corp | 音声始端検出装置 |
US4450531A (en) * | 1982-09-10 | 1984-05-22 | Ensco, Inc. | Broadcast signal recognition system and method |
US4547804A (en) * | 1983-03-21 | 1985-10-15 | Greenberg Burton L | Method and apparatus for the automatic identification and verification of commercial broadcast programs |
US4967273A (en) * | 1983-03-21 | 1990-10-30 | Vidcode, Inc. | Television program transmission verification method and apparatus |
DE3318919C2 (de) * | 1983-05-25 | 1985-03-21 | TeleMetric S.A., Internationale Gesellschaft für Fernsehzuschauerforschung, Zug | Verfahren und Vorrichtung zum Erfassen von Daten über das Fernseheinschaltverhalten von Fernsehzuschauern |
JPS6085753U (ja) * | 1983-11-18 | 1985-06-13 | 日本ビクター株式会社 | 磁気テ−プ記録再生装置 |
FR2559002B1 (fr) * | 1984-01-27 | 1986-09-05 | Gam Steffen | Procede et dispositif de detection d'une information audiovisuelle diffusee par un emetteur |
JPS60224341A (ja) * | 1984-04-20 | 1985-11-08 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法 |
US4697209A (en) * | 1984-04-26 | 1987-09-29 | A. C. Nielsen Company | Methods and apparatus for automatically identifying programs viewed or recorded |
JPS6136797A (ja) * | 1984-07-30 | 1986-02-21 | 松下電器産業株式会社 | 音声セグメンテ−シヨン法 |
US4677466A (en) * | 1985-07-29 | 1987-06-30 | A. C. Nielsen Company | Broadcast program identification method and apparatus |
US4697207A (en) * | 1985-09-30 | 1987-09-29 | Ampex Corporation | System for generating a synchronizing signal in response to two timing reference signals |
US4739398A (en) * | 1986-05-02 | 1988-04-19 | Control Data Corporation | Method, apparatus and system for recognizing broadcast segments |
US4718106A (en) * | 1986-05-12 | 1988-01-05 | Weinblatt Lee S | Survey of radio audience |
JPS6356091A (ja) * | 1986-08-26 | 1988-03-10 | Video Res:Kk | テレビ・コマーシャル放送確認方法 |
JPS6384396A (ja) * | 1986-09-29 | 1988-04-14 | Video Res:Kk | 視聴率測定用テレビ・センサ |
US4750034A (en) * | 1987-01-21 | 1988-06-07 | Cloeck En Moedigh Bioscoopreclame B.V. | Apparatus for monitoring the replay of audio/video information carriers |
DE3720882A1 (de) * | 1987-06-24 | 1989-01-05 | Media Control Musik Medien | Verfahren und schaltungsanordnung zum automatischen wiedererkennen von signalfolgen |
US4843562A (en) * | 1987-06-24 | 1989-06-27 | Broadcast Data Systems Limited Partnership | Broadcast information classification system and method |
JP2585041B2 (ja) * | 1988-01-08 | 1997-02-26 | 株式会社ビデオ・リサーチ | テレビ放送同一性判別方式 |
US4931871A (en) * | 1988-06-14 | 1990-06-05 | Kramer Robert A | Method of and system for identification and verification of broadcasted program segments |
US4945412A (en) * | 1988-06-14 | 1990-07-31 | Kramer Robert A | Method of and system for identification and verification of broadcasting television and radio program segments |
US4955070A (en) * | 1988-06-29 | 1990-09-04 | Viewfacts, Inc. | Apparatus and method for automatically monitoring broadcast band listening habits |
US5023929A (en) * | 1988-09-15 | 1991-06-11 | Npd Research, Inc. | Audio frequency based market survey method |
US5019899A (en) * | 1988-11-01 | 1991-05-28 | Control Data Corporation | Electronic data encoding and recognition system |
US4857999A (en) * | 1988-12-20 | 1989-08-15 | Peac Media Research, Inc. | Video monitoring system |
JPH03173291A (ja) * | 1989-11-15 | 1991-07-26 | Control Data Corp <Cdc> | ビデオ信号もしくはtv送信フレームからデジタルサインを生成する方法及び放送ビデオセグメントの連続パターン認識装置 |
JPH0666738B2 (ja) * | 1990-04-06 | 1994-08-24 | 株式会社ビデオ・リサーチ | Cm自動確認装置 |
JPH04355800A (ja) * | 1991-06-04 | 1992-12-09 | Sharp Corp | 音声認識装置 |
US5436653A (en) * | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
-
1992
- 1992-04-30 US US07/876,578 patent/US5436653A/en not_active Expired - Lifetime
-
1993
- 1993-04-30 CA CA002134748A patent/CA2134748C/en not_active Expired - Lifetime
- 1993-04-30 DK DK02076018T patent/DK1261155T3/da active
- 1993-04-30 DE DE69334130T patent/DE69334130T2/de not_active Expired - Lifetime
- 1993-04-30 EP EP93910943A patent/EP0748563B1/en not_active Expired - Lifetime
- 1993-04-30 WO PCT/US1993/004082 patent/WO1993022875A1/en active IP Right Grant
- 1993-04-30 EP EP02076018A patent/EP1261155B1/en not_active Revoked
- 1993-04-30 AT AT02076018T patent/ATE358366T1/de active
- 1993-04-30 CA CA002504552A patent/CA2504552C/en not_active Expired - Lifetime
- 1993-04-30 ES ES02076018T patent/ES2284777T3/es not_active Expired - Lifetime
- 1993-04-30 PT PT02076018T patent/PT1261155E/pt unknown
- 1993-04-30 DE DE69332671T patent/DE69332671D1/de not_active Expired - Lifetime
- 1993-04-30 JP JP5519540A patent/JPH08500471A/ja active Pending
- 1993-04-30 AT AT93910943T patent/ATE232036T1/de not_active IP Right Cessation
- 1993-04-30 AU AU42260/93A patent/AU678163B2/en not_active Expired
-
1995
- 1995-06-07 US US08/474,248 patent/US5504518A/en not_active Expired - Lifetime
- 1995-06-07 US US08/475,779 patent/US5612729A/en not_active Expired - Lifetime
- 1995-06-07 US US08/481,815 patent/US5621454A/en not_active Expired - Lifetime
- 1995-06-07 US US08/486,511 patent/US5572246A/en not_active Expired - Lifetime
-
1997
- 1997-08-19 AU AU34272/97A patent/AU718227B2/en not_active Expired
-
2000
- 2000-07-12 AU AU47161/00A patent/AU747044C/en not_active Expired
-
2003
- 2003-05-24 HK HK03103685A patent/HK1051938A1/xx not_active IP Right Cessation
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8364491B2 (en) | 2007-02-20 | 2013-01-29 | The Nielsen Company (Us), Llc | Methods and apparatus for characterizing media |
US8060372B2 (en) | 2007-02-20 | 2011-11-15 | The Nielsen Company (Us), Llc | Methods and appratus for characterizing media |
US8457972B2 (en) | 2007-02-20 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for characterizing media |
US9136965B2 (en) | 2007-05-02 | 2015-09-15 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
US8458737B2 (en) | 2007-05-02 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
US9460730B2 (en) | 2007-11-12 | 2016-10-04 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8369972B2 (en) | 2007-11-12 | 2013-02-05 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US9972332B2 (en) | 2007-11-12 | 2018-05-15 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US10580421B2 (en) | 2007-11-12 | 2020-03-03 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US10964333B2 (en) | 2007-11-12 | 2021-03-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US11562752B2 (en) | 2007-11-12 | 2023-01-24 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US11961527B2 (en) | 2007-11-12 | 2024-04-16 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
US9947327B2 (en) | 2008-01-29 | 2018-04-17 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable block length watermarking of media |
US10741190B2 (en) | 2008-01-29 | 2020-08-11 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable block length watermarking of media |
US11557304B2 (en) | 2008-01-29 | 2023-01-17 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable block length watermarking of media |
US8600531B2 (en) | 2008-03-05 | 2013-12-03 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
Also Published As
Publication number | Publication date |
---|---|
CA2504552C (en) | 2009-01-20 |
EP1261155A2 (en) | 2002-11-27 |
US5436653A (en) | 1995-07-25 |
AU4226093A (en) | 1993-11-29 |
US5612729A (en) | 1997-03-18 |
DE69332671D1 (de) | 2003-03-06 |
AU747044B2 (en) | 2002-05-09 |
JPH08500471A (ja) | 1996-01-16 |
DK1261155T3 (da) | 2007-08-06 |
US5621454A (en) | 1997-04-15 |
EP1261155A3 (en) | 2003-09-10 |
US5572246A (en) | 1996-11-05 |
EP1261155B1 (en) | 2007-03-28 |
EP0748563A1 (en) | 1996-12-18 |
AU4716100A (en) | 2000-09-14 |
DE69334130D1 (de) | 2007-05-10 |
DE69334130T2 (de) | 2007-12-13 |
ATE358366T1 (de) | 2007-04-15 |
EP0748563A4 (pt) | 1996-12-27 |
US5504518A (en) | 1996-04-02 |
ES2284777T3 (es) | 2007-11-16 |
HK1051938A1 (en) | 2003-08-22 |
CA2504552A1 (en) | 1993-11-11 |
AU718227B2 (en) | 2000-04-13 |
CA2134748A1 (en) | 1993-11-11 |
AU3427297A (en) | 1997-11-06 |
AU678163B2 (en) | 1997-05-22 |
WO1993022875A1 (en) | 1993-11-11 |
AU747044C (en) | 2004-05-06 |
CA2134748C (en) | 2005-07-26 |
ATE232036T1 (de) | 2003-02-15 |
EP0748563B1 (en) | 2003-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PT1261155E (pt) | Método e sistema para reconhecimento de segmentos de difusão | |
US7194752B1 (en) | Method and apparatus for automatically recognizing input audio and/or video streams | |
EP1774348B1 (en) | Method of characterizing the overlap of two media segments | |
EP2437255B1 (en) | Automatic identification of repeated material in audio signals | |
US8682651B2 (en) | Audio visual signature, method of deriving a signature, and method of comparing audio-visual data | |
US7305128B2 (en) | Anchor person detection for television news segmentation based on audiovisual features | |
US20020178410A1 (en) | Generating and matching hashes of multimedia content | |
US20030121046A1 (en) | Method and system for re-identifying broadcast segments using statistical profiles | |
US20090279840A1 (en) | Image Digesting Apparatus | |
US20070109449A1 (en) | Method and apparatus for automatic detection and identification of unidentified broadcast audio or video signals | |
BR102012024233A2 (pt) | Alinhamento temporal de sinais de áudio gravados | |
CN102132574A (zh) | 内容识别和质量监测 | |
US20020069408A1 (en) | Information transmission/reception system and method and information processing method and apparatus | |
KR101841985B1 (ko) | 오디오 핑거프린트 추출 장치 및 방법 | |
RU2352992C2 (ru) | Обнаружение водяного знака | |
KR100656373B1 (ko) | 시간구간별 우선순위와 판별정책을 적용하는 유해 동영상판별 방법 및 그 장치 | |
CA2628654A1 (en) | Method and system for updating a broadcast segment recognition database | |
KR101841983B1 (ko) | 오디오 핑거프린트 식별 장치 및 방법 | |
US20210219008A1 (en) | Content determination device, content determination method, and program | |
CN116206245A (zh) | 视频分类方法、装置、电子设备及存储介质 |