BR102014004527A2 - sistema de identificação de fonogramas - Google Patents
sistema de identificação de fonogramas Download PDFInfo
- Publication number
- BR102014004527A2 BR102014004527A2 BR102014004527A BR102014004527A BR102014004527A2 BR 102014004527 A2 BR102014004527 A2 BR 102014004527A2 BR 102014004527 A BR102014004527 A BR 102014004527A BR 102014004527 A BR102014004527 A BR 102014004527A BR 102014004527 A2 BR102014004527 A2 BR 102014004527A2
- Authority
- BR
- Brazil
- Prior art keywords
- phonogram
- hashes
- phonograms
- identification system
- compared
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/37—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/38—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/47—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising genres
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/48—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/49—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying locations
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
sistema de identificação de fonogramas. o presente sistema tem a capacidade de "escutar" ou monitorar uma infinidade rádios de forma simultânea. os streamings das rádios ou tvs são distribuídos em vários servidores que trabalham em conjunto. o sistema possui previamente inserido milhares de fonogramas (áudios em geral) que no momento de sua inserção são transformados em números e códigos e mantidos nos servidores para as futuras comparações. esse procedimento de comparação também é conhecido como matching.
Description
Relatório Descritivo da Patente de Invenção para "SISTEMA DE IDENTIFICAÇÃO DE FONOGRAMAS " Campo da Invenção [001] A presente invenção refere-se a um sistema de identificação e monitoramente em tempo real de fonogramas, mais especificamente músicas em uma pluralidade de rádios simultâneas. Esse sistema permite identificar a frequência, a data, o horário, a rádio ou canal de televisão de execução de fonogramas.
Descrição do Estado da Técnica [002] A tecnologia de Streaming foi criada em 1985 e a transmissão do primeiro fluxo de áudio ao vivo através de uma rede ocorreu somente em 1996. Inicialmente, os sons eram transmitidos em mono canal e não possuíam qualidade satisfatória, já que a taxa de frequência era baixa e a largura de banda era estreita.
[003] A tecnologia de Streaming possui grande diferencial em relação ao método de download do conteúdo, pois possibilita que o áudio ou o vídeo seja entregue ao usuário num fluxo contínuo com atraso mínimo antes do inicio da reprodução. Quando os dados são recebidos, faz-se um rápido buffer antes de iniciar a reprodução. Esses dados são então são descartados e não ocupam espaço no computador do usuário.
[004] Com a popularização da Internet em banda larga a transmissão de áudio e/ou vídeo por meio de Streaming através da rede mundial de computadores torna-se cada vez mais comum. A maioria das rádios atualmente disponibiliza via Streaming o mesmo conteúdo que é transmitido por meio eletromagnético convencional.
[005] O monitoramento de conteúdo de emissora de rádio e TV é um problema técnico antigo. Muitas invenções do estado da técnica propõem diversas soluções para a identificação de áudio e vídeo, entretanto nenhuma delas utilizou a técnica ensinada na presente invenção.
[006] O documento PI 0105831-2, depositado em 14/11/2001, descreve um sistema para monitoração e identificação de sinais eletrônicos transparentes aplicados em musica e mídia eletrônica emitidas via televisão e radio. Esse sistema identifica o sinal eletromagnético por meio de aparelhos receptores de sinais de radio ou televisão que captam e identificam os sinais eletrônicos invisíveis aplicados nas músicas e nas peças publicitárias televisivas ou radiofônicas. Esse sistema é capaz de codificar com referência à localização e comprime os dados para que sejam transmitidos pela Internet para uma central de controle computadorizada, que então descomprime os dados e os transforma em um banco de dados. Essa invenção do estado da técnica é conceitualmente diferente da invenção aqui ensinada, pois não utiliza Streamings de rádios e emissoras de televisão transmitidos via Internet para a realização do monitoramento.
[007] Desde 2005 já havia a intenção de realizar monitoramente de rádio e televisão via Internet. O documento US20040547931 depositado em 16/02/2005 apresenta um método e aparelho para detecção e identificação automática de um sinal de programação de difusão de áudio ou de vídeo. Esse método de detecção e identificação automática de programação de difusão de audiogramas por meio de radio, televisão, internet ou outros meios. Essa invenção se difere da invenção aqui ensinada já que não apresenta sistema detalhado de varredura simultânea dos streamings das rádios.
[008] O documento PI0703682-5, depositado em 11/09/2007, descreve um método de identificação de áudio para monitoramento de radio e televisão, além de um sistema de medição de audiência ou monitoramento. Esse método utiliza uma transformada de Fourier de pequenos intervalos do áudio transmitido em tempo real. Por meio da evolução temporal do espectro de frequência esse método é capaz de se receber uma corrente de entrada para comparar com a base de dados previamente constituída e reconhecer automaticamente exemplos das amostras registradas. Esse método permite monitorar, por meio de equipamento de medição de audiência, somente o conteúdo que os espectadores estão assistindo, o que se distancia da matéria apresentada na invenção aqui descrita, já que a mesma dispensa a utilização do referido equipamento.
[009] O documento BR 10 2012 019954-8, depositado em 09/08/2012, apresenta um sistema de monitoramento de transmissão de áudio de emissoras de rádio AM, FM e TV que utiliza técnicas de processamento de sinais de reconhecimento de padrões e de determinação da posição inicial, final e duração da identificação do fonograma. Esse algoritmo de reconhecimento é projetado para identificar fonogramas com base em suas propriedades acústicas e que é utilizado um sistema de assinaturas digitais que contém vetores numéricos que representam matematicamente a acústica harmônica do fonograma em sua totalidade. Já na invenção aqui proposta um servidor central armazena as musicas (ou fonogramas) em sua forma pura, chamadas de hashes ou códigos, que são obtidos pela conversão dos fonogramas em formato mp3 para mono canal 16 bits de streaming puro. Então o sistema seleciona pontos tão mínimos nos hashes de tal forma que o fonograma seja único, como se fosse uma impressão digital da musica. Para se realizar a verificação, o sistema acessa um banco de dados o qual possui uma grande quantidade de fonogramas já transformados em números. A partir dai o sistema contabiliza quantos hashes existem em comum com a música e, dependendo da quantidade de combinações positivas, o fonograma é identificado.
[010] Como pode se visto, apesar da vasta literatura patentária a respeito da identificação de fonogramas para fins de monitoramento nenhuma das invenções se aprofundou na técnica aqui apresentada.
Sumário da invenção [011] O presente sistema tem a capacidade de "escutar" ou monitorar uma infinidade de rádios de forma simultânea. Os streamings das rádios ou TVs são distribuídos em vários servidores que trabalham em conjunto.
[012] O sistema possui previamente inserido milhares de fonogramas (áudios em geral) que no momento de sua inserção são transformados em números e códigos e mantidos nos servidores para as futuras comparações. Esse procedimento de comparação também é conhecido como matching.
Descrição detalhada da invenção [013] No sistema são inseridas milhares de musicas (fonogramas) já transformadas em números. Os referidos fonogramas formam o banco de dados das musicas as quais serão comparadas com aquelas tocadas nas rádios por meio do matching.
[014] A partir desse momento o sistema passa a varrer os streamings das rádios várias vezes por segundo verificando se esses fonogramas estão tocando nas referidas rádios. No momento que o sistema identifica alguma música, essa é encaminhada para um banco de dados para assim fornecer ao usuário uma pluralidade de relatórios da maneira e combinação que o dito usuário necessitar. Esses relatórios podem ser apresentados por meio da discriminação e/ou combinação dos seguintes dados: região, estado, cidade, nome do artista, nome do fonograma, data e hora e, principalmente, o nome da rádio o qual o fonograma foi executado.
[015] O Sistema possui uma arquitetura de cliente servidor. Os ditos clientes são os "escutadores" das rádios (também chamados de radio iisteners), esses clientes enviam requisições que comparam a todo segundo ao servidor central do desse sistema.
[016] O servidor centrai armazena as musicas ou fonogramas em sua forma pura, chamadas de hashes ou códigos. Uma função hash é um algoritmo que identifica dados de comprimento variável e para dados de comprimento fixo. Os valores retornados por pela dita função hash são chamados valores hash, códigos hash ou ainda, como no caso da presente invenção, simplesmente hashes. Ou seja, um hash é uma sequência de bits gerados pelo referido algoritmo, que identifica dados de comprimento variável e os transforma para dados de comprimento fixo. O hash pode ser entendido como uma transformação de uma grande quantidade de dados em uma pequena quantidade de informações. Essa sequência busca identificar um arquivo ou informação unicamente. Resumidamente, um hash recebe um valor de um determinado tipo e retorna um código para o referido valor.
[017] Com a finalidade de se obter esses hashes, o presente sistema converte uma música inserida em mp3 para monocanal 16 bits de streaming puro - vetor (byte []). Esse vetor de bytes é modificado pelo uso de uma transformada de Fourier. A partir desse momento obtém-se uma série de números matemáticos complexos. Dessa forma, pode-se calcular o valor absoluto de cada número complexo e também calculara magnitude: mag = Math.log(absoluteValue + 1);
[018] O presente sistema seleciona então pontos tão mínimos nos hashes a ponto de que cada fonograma seja único, como uma impressão digital da música. Cada hash é armazenado de uma maneira na lista de fonogramas de comparação para que seja único, representando o tempo e a posição do fonograma na lista.
Procedimento para realização do match [019] Para realizar um match um trecho de 20 segundos do fonograma é gravado. O sistema usa o ffmpeg para gravar preferivelmente os referidos 20 segundos de stream uri da rádio e o salva como mp3. A partir desse momento o presente sistema converte o mp3 para hashes, da mesma forma como descrito acima, para o procedimento de criação da lista de hashes dos fonogramas de comparação. Na sequencia, enviar os referidos hashes para o servidor principal para a realização do match.
[020] O sistema contabilizará então a quantidade de hashes para cada fonograma, pois como mencionado, eles são códigos únicos, como uma impressão digital do fonograma.
[021] No caso de serem encontrados mais de 20 hashes iguais no mesmo fonograma o presente sistema entende que se trata do mesmo fonograma, pois seria impossível duas musicas com 20 hashes iguais. Esse valor preferível de 20 hashes foi obtido de forma empírica, após milhares de testes com uma grande diversidade de fonogramas.
[022] Cada fonograma passa pela etapa de match uma vez a cada 6 minutos por rádio, sendo assim, o dito fonograma será identificado preferivelmente, para as rádios monitoradas, uma vez a cada seis minutos.
Reivindicações
Claims (4)
1. SiSTEMA DE IDENTIFICAÇÃO DE FONOGRAMAS, caracterizado pelo fato de possuir as etapas de: - obter os hoshes dos fonogramas de comparação por meio da conversão do fonograma em formato mp3 para monocanal 16 bits de streaming puro modificado pelo uso de uma transformada de Fourier; - obter uma série de números matemáticos complexos a partir da referida conversão; - calcular o valor absoluto de cada número complexo e também calcular a sua magnitude: mag = Math.log(absoluteValue + 1); - selecionar pontos mínimos nos hashes para que cada fonograma seja unicamente identificado; - armazenar cada hash na lista de fonogramas de comparação representando o tempo e a posição do fonograma na referida lista; - gravar um trecho do fonograma de stream a ser comparado usando ffmpeg e salvar em formato mp3; - utilizar nos fonogramas a serem comparados o mesmo procedimento para a criação da lista de hashes dos fonogramas de comparação; - enviar os referidos hashes para o servidor principal para a realização do match.
2. SiSTEMA DE IDENTIFICAÇÃO DE FONOGRMAS, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de match consiste em contar a quantidade de hashes para cada fonograma que se está comparando e caso a correspondência for superior a 20 hashes para um único fonograma a correspondência será positiva.
3. SISTEMA DE IDENTIFICAÇÃO DE FONOGRMAS, de acordo com a reivindicação 2, caracterizado pelo fato de que cada fonograma passar pela etapa de match preferivelmente uma vez a cada 6 minutos.
4. SISTEMA DE IDENTIFICAÇÃO DE FONOGRMAS, de acordo com a reivindicação 1, caracterizado pelo fato de que o tempo de gravação do trecho do fonograma a ser comparado ser preferivelmente 20 segundos.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BR102014004527A BR102014004527A2 (pt) | 2014-02-26 | 2014-02-26 | sistema de identificação de fonogramas |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BR102014004527A BR102014004527A2 (pt) | 2014-02-26 | 2014-02-26 | sistema de identificação de fonogramas |
Publications (1)
Publication Number | Publication Date |
---|---|
BR102014004527A2 true BR102014004527A2 (pt) | 2016-02-02 |
Family
ID=55182667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR102014004527A BR102014004527A2 (pt) | 2014-02-26 | 2014-02-26 | sistema de identificação de fonogramas |
Country Status (1)
Country | Link |
---|---|
BR (1) | BR102014004527A2 (pt) |
-
2014
- 2014-02-26 BR BR102014004527A patent/BR102014004527A2/pt not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10848821B2 (en) | Watermark based content recognition improvements | |
US9596386B2 (en) | Media synchronization | |
JP2023090754A (ja) | 再生方法および再生装置 | |
US8020000B2 (en) | Method and device for generating and detecting a fingerprint functioning as a trigger marker in a multimedia signal | |
US11689769B2 (en) | Methods and apparatus to measure exposure to streaming media | |
WO2016011823A1 (zh) | 获取直播视频切片的方法、服务器及存储介质 | |
CN104598541A (zh) | 多媒体文件的识别方法、装置 | |
CN110113626B (zh) | 一种回放直播视频的方法及装置 | |
TW202315415A (zh) | 使用帶內元資料作為存取參考指紋的基礎,以促進與內容相關的動作 | |
CN108111872A (zh) | 一种音频直播系统 | |
US20220210215A1 (en) | Methods and apparatus to monitor streaming media | |
CN106233733A (zh) | 将隐藏字幕用于电视收视测量的系统和方法 | |
JP2016529794A (ja) | 断片化の前にコンテンツに透かしを入れるための方法およびシステム | |
BR102014004527A2 (pt) | sistema de identificação de fonogramas | |
US10298984B2 (en) | Network PVR | |
WO2018160007A1 (ko) | 멀티미디어 데이터를 처리하는 방법 및 장치 | |
US20170142179A1 (en) | Delivery of media content segments in a content delivery network | |
CN110545447B (zh) | 一种音视频同步的方法及装置 | |
KR102210509B1 (ko) | 멀티미디어 시스템에서 컨텐츠를 변환하는 방법 및 장치 | |
KR20200142496A (ko) | 부가 신호를 일차 신호와 동기화하기 위한 방법 | |
JP5610904B2 (ja) | 配信デジタル音楽データ再生システム | |
JP5288927B2 (ja) | 情報処理装置及びプログラム | |
Ninomiya et al. | Inferring Live Streaming Delays in the Wild. | |
WO2022189341A1 (en) | Apparatus and method for leveling main and supplementary audio from a hbbtv service | |
CN117083864A (zh) | 用于均衡来自hbbtv服务的主音频及辅助音频的设备及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B03A | Publication of an application: publication of a patent application or of a certificate of addition of invention | ||
B08F | Application fees: dismissal - article 86 of industrial property law | ||
B08K | Lapse as no evidence of payment of the annual fee has been furnished to inpi (acc. art. 87) |