WO2021058384A1

WO2021058384A1 - Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé

Info

Publication number: WO2021058384A1
Application number: PCT/EP2020/076072
Authority: WO
Inventors: David Vincent; Frédéric BEAUCHAMP
Original assignee: Tdf
Priority date: 2019-09-26
Filing date: 2020-09-18
Publication date: 2021-04-01
Also published as: FR3101451A1; FR3101451B1

Abstract

L'invention concerne un procédé d'identification de contenu audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée à des utilisateurs. Le procédé est caractérisé en ce qu'il comporte les étapes suivantes exécutées au niveau d'un serveur (1) : une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d'au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison (5.4) d'informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, une étape d'association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination. De cette manière, il est possible d'identifier chaque flux par son contenu audio et d'effectuer des comparaisons de ce contenu avec d'autres pour générer des associations entre des sources émettant le même contenu.

Description

DESCRIPTION

Titre : Procédé d’identification de flux audio provenant d’une pluralité de sources, système, récepteur et programme associé au procédé

1. DOMAINE DE L’INVENTION

Le domaine de l’invention est celui de l’identification des contenus audio accessibles par un récepteur capable de recevoir à la fois des contenus d’un réseau de diffusion et d’un réseau bidirectionnel. L’invention concerne plus particulièrement le fait de comparer les signaux audio en provenance des différentes sources et d’établir des identificateurs en fonction des identités et des ressemblances entre les signaux audio

2. ARRIÈRE-PLAN TECHNOLOGIQUE

Dans le domaine de la diffusion de contenus audio ou audiovisuels, il est connu des récepteurs dits « hybrides » capables de recevoir et de reproduire à la fois des émissions en provenance d’un réseau de diffusion, des contenus transmis à partir d’un site Web, et des contenus transmis en baladodiffusion ou « podcast » selon la terminologie anglo-saxonne. Ces récepteurs sont dotés d’une interface utilisateur comportant un écran et d’un moyen d’introduction de commandes (clavier, écran tactile, reconnaissance vocale, ..), des moyens de réception radio et des moyens d’émission de signaux sonores vers des haut- parleurs. L’utilisateur règle son appareil pour recevoir un contenu diffusé à la radio, ou en provenance d’un site Internet. Certains appareils hybrides peuvent enrichir la réception de contenus audio diffusés par une connexion de type Internet ou « IP », par exemple en améliorant la zone de couverture des contenus diffusés en combinant leurs réceptions traditionnelles par réseau de diffusion selon les normes de diffusion suivantes (liste non limitatives) :

- FM (Fréquence Modulée) ou AM (modulation d’amplitude),

- DAB (acronyme de Digital Audio Broadcasting »), DAB+,

- DMB,

- DRM, DRM+,

- DVB (acronyme de Digital Vidéo Broadcasting »), DVB-T (le « T » signifiant « Terrestre »), DVB-S (le « S » signifiant « Satellite»), avec des téléchargements ou « streaming » selon la terminologie anglo- saxonne par réseau IP (Wifi, 3G, 4G et 5G dans un futur proche). Ces différentes sources peuvent fournir le même contenu audio. En effet, il est fréquent qu’une station radio nationale émette des signaux radio en FM à partir d’un réseau terrestre hertzien, des signaux numériques selon le standard DAB (acronyme de « Digital Audio Broadcasting »), et dispose d’un site Web accessible par une adresse IP pour transmettre le contenu audio émis en temps réel. Un utilisateur règle ou programme son récepteur pour recevoir les signaux audio selon l’une quelconque de ces sources pour recevoir le même contenu.

Il est également connu des bases de données qui recensent un grand nombre de sources et fournissent des identifiants pour recevoir tel ou tel programme. Ces bases de données reçoivent en entrée des noms de station d’émission ou de programmes audio, et fournissent des identifiants de stations radio avec les données permettant de recevoir les émissions. Les informations relatives aux stations de radio qu’elles contiennent peuvent être de nature diverse : nom de chaque station, genres, identifiants, logos, localisation géographique, paramètres des émetteurs, programmes du jour ou hebdomadaire, détails de l’émission en cours, URLs de streaming. Ce service est accessible par Internet et l’accès de ces bases est généralement payant.

Ces bases sont mises à jour par les gestionnaires des stations radio et de façon plus générale par les fournisseurs de contenus audio qui ont intérêt à se faire connaître du public pour ainsi augmenter leur audience. Ces bases reçoivent donc des informations en provenance d’émetteurs certifiés mais ne vérifient pas si les contenus émis par les sources identifiées par les informations reçues correspondent bien aux signaux audio diffusés par ces fournisseurs de contenu. Cette absence de vérification peut entraîner des erreurs dans l’identification des contenus.

Tout d’abord, les différentes bases de données sources ne possèdent pas forcément un identifiant commun pour une même radio, chacune de ces bases de données peut identifier un même contenu audio de plusieurs façons différentes. Prenons par exemple, le nom d’une station radio tel que R.T.L., qui est l’acronyme de « Radio Télé Luxembourg », ce nom peut s’écrire soit en majuscule : « RTL », soit en minuscule « rtl », soit séparé par des points « R.T.L. ». Bien que ces trois écritures désignent bien la station de radio dans l’esprit du public, l’informatique considère que ce sont trois identifiants différents.

L’identifiant d’une même source audio peut également dépendre de la façon de la recevoir, cet identifiant peut par exemple être suffixé par « PI » (signifiant « Program Identifier » qui est un identifiant du système RDS mis en œuvre dans les radio FM) ou par « FM ». De la même façon, une même station de radio peut avoir des URLs différentes dans plusieurs bases.

De plus, il arrive que, soit du fait d’erreurs lors de la collecte de ces URLs, soit du fait d’évolution de celles-ci, une URL associée à une station de radio ne soit plus connectée à un flux correspondant à la station de radio à laquelle elle est associée. Du fait d’erreurs informatiques ou humaines, une URL peut pointer vers le flux d’une autre station de radio.

Enfin, un fournisseur de contenu peut transmettre des informations pour identifier une certaine source à un certain moment et celles-ci sont ensuite rendues obsolètes. De même, il est possible que les informations transmises soient erronées. De façon générale, les problèmes de cohérence des données entre les bases évoluent dans le temps. Certaines erreurs sont corrigées et d’autres apparaissent à la suite d’une mise à jour par exemple. Il est donc difficile à un instant donné d’être sûr d’introduire le bon identifiant d’une source pour obtenir les moyens de recevoir le flux audio associé.

3. OBJECTIFS DE L’INVENTION

Il existe donc un réel besoin d’un procédé permettant d’associer au moins un identifiant d’une source audio qui est connu des utilisateurs, avec au moins un moyen pour recevoir le flux audio ainsi identifié.

L’invention propose également un serveur pour récolter des informations sur la disponibilité des flux audio et pour associer des sources émettant le même contenu audio avec au moins une dénomination de ce contenu qui est connue des utilisateurs.

4. PRESENTATION DE L’INVENTION

Dans un mode de réalisation particulier de l’invention, il est proposé un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) :

- une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,

- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, - une étape de comparaison (5.4) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,

- une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination.

Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio, de collecter des informations provenant de diverses bases de données et de les rassembler pour créer des associations pour fournir des identifiants de source lorsqu’un utilisateur désire recevoir un certain contenu.

Selon un premier mode de réalisation, l’étape de comparaison consiste à comparer des signatures calculées sur les segments émis par chacune des sources. De cette manière, la comparaison est facilitée.

Selon un autre mode de réalisation, l’étape de comparaison commence par une sous-étape consistant en ce que les segments émis par les sources émettant les flux audio ayant la même dénomination sont comparés entre eux, ladite sous-étape déclenchant une sous-étape d’association de cette dénomination avec les identifiants de sources audio émettant le même contenu. De cette manière, le procédé compare d’abord les contenus audio ayant la même dénomination et s’ils sont identiques, les identifiants de sources sont alors rassemblés dans une même association, ce qui minimise le temps de traitement.

Selon un autre mode de réalisation, l’étape de comparaison détermine un niveau de similitude entre les contenus, et en ce que l’étape d’association associe également une information représentative de la similitude entre les contenus. De cette manière, les contenus présentant une grande similitude peuvent être facilement rassemblés, et proposés à des fins de reproduction.

Selon un autre mode de réalisation, l’étape de comparaison détecte des redondances de certains contenus à des moments périodiques déterminés, l’étape d’association associe alors également une donnée signifiant le caractère périodique des similitudes des contenus émis par deux sources différentes. De cette manière, les utilisateurs peuvent être informés que certaines sources fournissent des contenus identiques sauf à des moments déterminés, ce qui est le cas de station radio nationales et locales. Selon un autre mode de réalisation, le procédé d’identification comporte les étapes ultérieures suivantes exécutées au niveau d’un récepteur : émission vers le serveur d’une requête comportant une dénomination d’un flux audio, réception en provenance dudit serveur d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié, présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux. De cette manière, G utilisateur est ainsi informé des associations et peut choisir la source qui lui convient pour recevoir un certain contenu.

Selon un autre mode de réalisation, le message transmis au récepteur contient également l’information représentative de la similitude entre les contenus, et en ce que l’étape de présentation de chaque identifiant présente également pour chaque identifiant ladite information représentative de la similitude entre les contenus. De cette manière, l’utilisateur est informé des associations et peut choisir la source qui lui convient pour recevoir un contenu souhaité.

Selon un autre mode de réalisation, des identifiants différents de sources sont associés à des dénominations différentes, ces sources émettant le même contenu audio. De cette manière, si un même contenu est accessible sous plusieurs dénominations, il est facile de retrouver les sources qui les émettent.

Selon un autre mode de réalisation, le procédé d’identification comporte une étape d’évaluation de la validité d’au moins deux dénominations associées à un même contenu émis par deux sources différentes, l’étape d’association associant les identifiants de ces sources différentes avec la dénomination ayant la valeur de validité la plus grande.

L’invention concerne également un serveur d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs. Le serveur comporte un moyen de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, un moyen de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, un moyen de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus et une mémoire pour enregistrer les associations des identifiants de sources audio émettant le même contenu avec au moins une dénomination. L’invention concerne également un récepteur de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs, ledit récepteur comporte des moyens de réception des contenus audio transmis dans le flux, des moyens de reproduction desdits contenus, un moyen d’émission d’une requête vers un serveur distant contenant une dénomination de contenu afin de recevoir une liste des identifiants de sources audio émettant le contenu identifié par cette dénomination, un moyen d’affichage de la liste reçue et un moyen de sélection d’une des sources affichées afin de lancer la reproduction du contenu émis par cette source.

5. DESCRIPTION DES FIGURES

D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description suivante, donnée à titre d’exemple indicatif et non limitatif, et des dessins annexés, dans lesquels :

-[Fig 1] : la figure 1 présente la structure d’un serveur pour produire des associations de contenus et de sources audio, selon un mode de réalisation particulier de l'invention ;

-[Fig 2] : la figure 2 illustre les principaux composants d’un appareil récepteur d’un contenu audio, selon un exemple de réalisation ;

-[Fig 3] : la figure 3 présente un schéma général du traitement des données afin de produire des associations de contenus et de sources audio ;

-[Fig 4] : la figure 4 présente un ordinogramme des étapes de recherche pour collecter des informations sur les sources audio, selon un exemple de réalisation ;

-[Fig 5] : la figure 5 représente un ordinogramme des étapes de traitement en vue de produire des associations de contenu et de source selon un exemple de réalisation.

6. DESCRIPTION DETAILLEE D’UN MODE DE REALISATION

L’invention concerne un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur : une étape de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, et une étape d’association des identifiants de sources audio émettant le même contenu avec au moins une dénomination. Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio et d’effectuer des comparaisons de ce contenu avec d’autres contenus pour générer des associations entre des sources émettant le même contenu.

(72 _ _Description_d ’_un mode particulier de_réali_sation

Sur toutes les figures du présent document, les éléments (ou les étapes) identiques sont désignées par une même référence numérique.

On présente maintenant, en relation avec la fig. 1, une structure d’un serveur 1, selon un mode de réalisation particulier de l'invention. Ce serveur constitue une plateforme de service accessible par un réseau, Internet par exemple, pour obtenir des moyens de réception d’un flux audio déterminé. Ce flux audio est constitué d’une succession de paquets de données émis par une certaine source, la charge utile des paquets contenant des signaux sonores pour produire un son au niveau d’un récepteur et le faire entendre à des utilisateurs. Une source audio est identifiée par un identifiant qui dépend du type de source, si les signaux proviennent d’une station radio FM alors l’identifiant peut être une fréquence porteuse, si les signaux proviennent d’un site informatique, l’identifiant est généralement une URL.

Le serveur 1 comporte typiquement une unité centrale 2 associée à une mémoire de programme 3, un module de réception d’un flux radio 4 recevant des émissions d’un réseau de diffusion monodirectionnel, un réseau FM par exemple, et un module de communication 5 pour des communications bidirectionnelles à Laide d’un câble. Dans un cas très particulier, où le serveur 1 est directement accessible par un opérateur, il dispose alors de moyens d’entrée/sortie local 6 pour une connexion avec un terminal et/ou une imprimante. Le récepteur dispose également d’une mémoire 7 capable de stocker des données en provenance de l’un quelconque des moyens de réception unidirectionnel ou bidirectionnel et pour mémoriser des données d’associations entre des sources audio et des dénominations de contenus. La Fig. 2 illustre les principaux composants d’un appareil récepteur 10, selon un mode de réalisation particulier de l'invention. Le récepteur 10 comporte typiquement une unité centrale 11 associée à une mémoire de programme 12, un module de réception d’un flux radio 13 recevant des émissions d’un réseau monodirectionnel, un réseau FM par exemple, et un module de communication 14 autorisant des communications bidirectionnelles à courte ou à longue portée par un câble ou par la radio, en utilisant par exemple le réseau Bluetooth, Wifi et/ou GSM. Le récepteur dispose également de moyens d’introduction de commande 15 (clavier, boutons, écran tactile, ...), et de moyens d’affichage 16 (écran, voyants lumineux, synthèse vocale, ...). Ces moyens peuvent être intégrés à l’appareil ou déportés. L’appareil dispose également d’un moyen de reproduction d’un contenu audio, composé par exemple d’un écran déporté, et/ou d’un amplificateur 17 intégré à l’appareil émettant des signaux acoustiques vers des haut-parleurs déportés 18. Selon un perfectionnement non obligatoire, le récepteur 10 dispose également d’une mémoire 19 capable de stocker un contenu audio et/ou visuel diffusé par un réseau unidirectionnel ou bidirectionnel.

Le récepteur 10 reçoit une alimentation électrique ou dispose de sa propre batterie. Il peut être mobile et prendre l’aspect d’un téléphone portable intelligent (ou « smartphone » selon la terminologie anglo-saxonne. Il peut par exemple être embarqué dans un véhicule itinérant, le récepteur est alors un autoradio.

Le récepteur permet de recevoir un flux audio d’une source distante. L’utilisateur introduit une dénomination d’un contenu audio et le récepteur émet une requête vers le serveur 1 pour recevoir au moins un identifiant d’une source émettant le flux de ce contenu audio.

Après avoir détaillé les principaux dispositifs permettant de mettre en œuvre le procédé, nous allons maintenant expliquer comment ceux-ci coopèrent.

La Fig. 3 présente un schéma général du traitement des données afin de produire des associations de contenus et de sources audio. Un serveur 30 dit « Data updater » est chargé de collecter des données provenant d’une pluralité de sources différentes 31, 32. Les données collectées associent un certain identifiant de contenu audio avec une source. Les données collectées sont rassemblées dans une mémoire 33 dites de « données brutes ». A un certain moment, un module d’analyse 34 est exécuté afin de lire ces données, de les convertir en signaux audio et de les transmettre à un module de comparaison 35 de ces signaux audio afin d’en déterminer les similitudes, les différences et les identités.

Les modules d’analyse 34 et de comparaison 35 produisent des données validées consistant en une liste d’associations de dénominations de contenus avec des identifiants de sources audio de différents types permettant à des récepteurs 10 de recevoir ces contenus audio.

Nous allons maintenant détailler plus spécifiquement les différentes opérations permettant de produire les données validées.

6.3 Phase de recherche d’informations

Selon une première phase de recherche d’informations, qui est illustrée par la Fig. 4, les données relatives à des identifiants de sources audio vont être rassemblées dans une base de données dites « brutes », en ce sens qu’elles sont mémorisées sans traitement préalable. Le serveur 1 collecte des données en permanence et de façon cyclique, la durée de chaque cycle dépendant du nombre de stations radio à scanner, et des bases de données à interroger.

Selon une étape 4.1, le serveur 1 émet des requêtes à destination des bases de données publiques ou privées, dans le but de recevoir de ces bases des associations d’ identifiants et de moyens de réception. Le serveur réceptionne les données d’associations et les enregistre dans la mémoire 7.

Selon une autre étape 4.2, le serveur 1 scanne les fréquences FM en vue de découvrir les stations radio qui diffusent actuellement des contenus audio. L’identité de la station émettrice peut être déterminée en utilisant le système R.D.S. qui consiste à incorporer dans les signaux radio l’identifiant de la station. Une autre façon de faire consiste à analyser les signaux audio de façon à détecter des jingles qui sont très souvent caractéristiques de la station, ces jingles peuvent être uniquement musicaux, ou contenir le nom de la station. Après chaque scan des fréquences, le serveur enregistre dans la mémoire 7 des associations entre un nom de station émettrice et une fréquence donnée.

Selon une autre étape 4.3, le serveur interroge des sites déjà référencés et qui sont censés émettre des signaux audio en continu. Un segment audio d’une courte durée peut être enregistré dans la mémoire à des fins de vérification de l’identification. Ces trois étapes peuvent se dérouler en même temps puisqu’elles peuvent utiliser des ressources matérielles différentes. A la fin de chaque cycle de collecte, la mémoire 7 contient des données brutes qui sont ensuite exploitées pour générer des listes vérifiées associant au moins une dénomination d’un contenu audio avec des identifiants de sources audio (étape 4.4).

6.4 Phase de traitement des informations récoltées

Le traitement des données brutes est schématisé par l’ordinogramme de la Fig. 5. L’ensemble des identifiants de sources audio enregistrés dans la mémoire 7 sont comparés les uns aux autres afin de détecter des identités. A l’étape 5.1, le serveur recherche les associations ayant les mêmes dénominations de flux audio et les mêmes identifiants de sources audio. Dans ce cas, il est inutile de maintenir des associations en double, et les deux associations sont réduites à une seule. Le serveur calcule ensuite les signatures des signaux audio émis par toutes les sources identifiées dans la base de données brutes (étape 5.2), ce calcul s’effectue globalement pour tous les signaux au cours d’une certain laps de temps, ou en tant que tache de fond. Le calcul peut aussi s’effectuer ponctuellement lorsque le traitement a besoin de calculer la signature d’un contenu. Le calcul de signature s’effectue en recevant le contenu audio émis par une source identifiée (en se connectant à une adresse IP, ou en réglant le moyen de réception radio 4 avec la fréquence identifiée) et en utilisant les données reçues dans le flux.

A l’étape 5.3, le serveur recherche des associations comportant les mêmes dénominations de flux audio et des identifiants de source différents. Le serveur vérifie alors en les comparant si les contenus audio émis par les sources ainsi identifiées sont identiques (étape 5.4). Pour cela, le serveur utilise un module de comparaison de signaux audio qui est une technique connue en soi. Le brevet n° EP 1 741 047 déposé par la demanderesse le 18 Mars 2005 décrit un procédé utilisant une signature de signaux audio afin de déterminer les ressemblances, les différences et les similitudes de deux flux audio. Si à l’issue de cette comparaison, les contenus audio sont les mêmes, alors on peut déduire qu’il ne forme qu’un et que ce dernier est accessible selon au moins deux sources. Dans ce cas, le serveur crée une association entre cet identifiant et les deux sources découvertes, et enregistre cette association dans une partie dédiée de la mémoire 7 (étape 5.5). Chaque fois que, dans les données brutes, le serveur détermine que le même contenu audio désigné par le même identifiant, est transmis par des sources différentes, il associe alors l’ensemble des sources à cet identifiant.

Si par contre les contenus audio ne sont pas les mêmes, alors une des deux dénominations peut être erronée. Dans ce cas et selon une première stratégie, le serveur recherche dans le flux des informations sur la dénomination du contenu audio émis. Ces informations peuvent être des données spécifiques de type RDS émises dans un flux unidirectionnel, ou des données récurrentes émises toutes les heures et caractéristiques d’un certain contenu audio. Par exemple, certaines stations radio émettent à chaque changement d’heure un jingle qui est reconnaissable et spécifique à la station. Le serveur peut disposer d’une bibliothèque de jingles permettant de mieux identifier des contenus audio. Selon une seconde stratégie, le serveur compare les signaux audio d’un contenu avec les signaux audio des autres contenus accessibles par les données brutes enregistrées dans la mémoire (étape 5.6). Si un autre contenu est trouvé, alors il est possible de rectifier la dénomination du premier contenu en utilisant le second. La correction d’une dénomination est habituellement basée sur un indice de confiance, cet indice est maximal lorsque la dénomination est extraite d’un flux (par des signaux RDS par exemple). Si la dénomination n’est pas lisible dans les signaux, l’indice peut être proportionnel au nombre d’associations entre un même contenu et un même identifiant de source. Si par exemple, un même contenu audio est accessible selon cinq sources différentes et qu’il est dénommé quatre fois selon une première dénomination et une autre fois avec une autre, la première dénomination est clairement la plus plausible. Dans ce cas, et selon une première variante, le serveur considère que la dénomination la moins plausible est erronée, elle doit être supprimée et remplacée par la dénomination la plus plausible. Selon une seconde variante, le serveur agglomère toutes les dénominations dans une liste, qui est associée à la liste de tous les identifiants de source. Si un récepteur émet vers le serveur 1 une requête de réception en transmettant une dénomination d’un contenu, il recevra la liste de tous les identifiants de source associés à cette dénomination. Selon un perfectionnement, l’indice de confiance associé à chaque dénomination est également transmis, de cette façon l’utilisateur peut se rendre compte de la dénomination la plus sûre pour désigner ce contenu. L’étape 5.6 compare également les données des flux dont les identifiants n’ont été recensés qu’une seule fois, ces flux sont dits « unitaires ». Si à l’étape 5.6, la dénomination d’un contenu n’a été trouvée qu’une seule fois dans les recherches effectuées au cours des étapes 4.1, 4.2 et 4.3, et que ce contenu est identique à celui émis par une autre source sous une autre dénomination, alors les deux dénominations ainsi que les deux identifiants de ces deux sources sont agglomérés et référencés dans une même association (étape 5.5). Prenons par exemple la station radio RTL qui émet des ondes radio sur la fréquence porteuse de 104,3 Mhz et supposons que le contenu de cette radio est également accessible sous la dénomination « R.T.L. » à l’adresse URL_1, alors le serveur 1 produit l’association ci-dessous et la mémorise dans la partie dédiée de la mémoire 7 :

[RTL ou R.T.L. / 104,3 MHz ou URL_1]

Si plus tard, un récepteur demande une source fournissant le contenu de cette station radio, la requête pourra indifféremment contenir « RTL » ou « R.T.L. », et la réponse contiendra au moins l’ensemble des identifiants de sources : 104,3 MHz ou URL_1. De cette manière, un utilisateur d’un tel récepteur pourra choisir qu’elle est la source qu’il désire utiliser pour recevoir ce contenu. S’il sait que son récepteur dispose d’un faible débit par son réseau de communication filaire, il peut choisir le flux radio. Par contre, s’il sait que les conditions radio ne sont pas bonnes, il pourra privilégier le réseau filaire.

Si par contre, le contenu analysé n’est identique à aucun autre, aucune autre association ne sera produite et les données de ce contenu enregistrées dans la mémoire dédiée resteront les mêmes que les données brutes. Il ne sera possible d’accéder à ce contenu que par un seul moyen (étape 5.7).

A l’issue des étapes 5.5, 5.6 et 5.7, les associations d’identifiants et de dénominations de sources sont rassemblées dans une même base de données dites dédiée, qui est enregistrée dans la mémoire 7 du serveur 1 (étape 5.8). A l’étape 5.9, un utilisateur peut utiliser son récepteur 10 pour accéder au serveur 1 et lui demander par une requête contenant au moins une dénomination de contenu au moins un identifiant d’une source pour recevoir ce contenu. Le serveur 1 lit alors dans sa mémoire 7 et recherche les associations contenant la dénomination indiquée, il renvoie alors les identifiants associés. Le récepteur 1 présente les données transmises dans un menu affiché à l’écran 16. Ce menu fait apparaître la liste des identifiants de source, mais aussi les autres dénominations désignant le même contenu audio. L’utilisateur sélectionne alors un des identifiants de source affichés, ce qui déclenche la connexion à cette source et la réception au niveau du récepteur du contenu demandé.

Une fois que toutes les signatures ont été comparées au moins une fois avec une autre signature, et que toutes les associations ont été mémorisées dans la mémoire dédiée, le serveur repart pour un nouveau traitement, en utilisant de nouveaux segments. De cette manière, la liste des associations est constamment mise à jour.

Il s’avère que de nombreux contenus sont émis par au moins deux sources, il est donc avantageux de profiter de ces identités pour regrouper ces sources de façon à réduire le nombre des comparaisons. Le déroulement d’étapes décrit ci-dessus permet de réduire le nombre de contenus à comparer et donc le nombre de signature, en regroupant les sources qui émettent le même contenu. Le déroulement d’étapes permet également de vérifier l’exactitude des identifiants de source et des dénominations.

6.5 Détermination de similitudes entre les signatures

Dans certains cas, les modules de comparaison de signatures deux à deux, qui sont mis en œuvre lors des étapes 5.4 et 5.6, fournissent trois résultats : les signatures sont parfaitement identiques, les signatures sont partiellement identiques, les signatures sont complètement différentes.

Les signatures sont partiellement identiques lorsque par exemple, les deux contenus sont fournis par une station de diffusion nationale et par une station locale. Dans un tel cas, la plupart du temps, les contenus sont identiques mais à certaines heures, le contenu national est remplacé par un contenu local, par exemple un journal régional, ou un reportage sur une activité locale. Selon un autre exemple, la station émet des séquences publicitaires au cours de plages temporelles dédiées, le contenu de ces plages est modifié pour être remplacé par un contenu plus adapté localement. Le module de comparaison de signatures détecte une grande similitude entre les données et peut déterminer qu’au cours d’un grand laps de temps, les signaux sonores sont identiques. Selon la présente invention, si les signatures sont parfaitement identiques, alors les contenus sont identiques et les sources associées émettent le même contenu audio. Ces sources sont associées avec le ou les mêmes dénomination(s) de contenu.

Si les signatures sont partiellement identiques, un module de vérification détecte les redondances entre les identités et les différences de contenus. Si les différences interviennent aléatoirement, il peut s’agir d’événements dus à une mauvaise réception et/ou à la présence de parasites, ou encore le fruit du hasard.

C’est le cas par exemple de deux stations radio différentes qui diffusent la même chanson quasiment au même moment. Dans ce cas, le module de vérification considère que ce sont deux contenus différents. Si par contre les redondances sont nombreuses et les différences apparaissent très régulièrement et pendant une période constante d’une fois sur l’autre, alors on peut considérer qu’un des contenus est une déclinaison de l’autre. Dans ce cas, les deux sources, et éventuellement les deux dénominations (si elles sont différentes, par exemple des noms de stations comportant le nom de la région de diffusion) sont enregistrées dans la mémoire dédiée selon la même association. Une indication est rajoutée pour indiquer que les contenus sont identiques sauf à certains moments. De cette façon, un utilisateur peut être averti qu’il peut recevoir plusieurs déclinaisons locales d’une même station radio nationale, et peut éventuellement sélectionner des contenus qui ne correspondent pas à sa région.

Le module de vérification analyse les contenus au cours d’une période de temps assez longue, de l’ordre de 12h ou de 24 heures, en commençant de préférence à un moment particulier, à OOhOO par exemple.

Selon un perfectionnement, le procédé utilise un module d’évaluation des similitudes entre des dénominations, ce module détermine à l’étape 5.4 que les dénominations sont similaires et les traite comme si elles sont identiques. C’est le cas par exemple lorsque les dénominations sont écrites l’une en majuscule, et l’autre en minuscule, ou encore lorsqu’une faute d’orthographe s’est glissée dans l’une des dénominations.

Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation doivent être considérés à titre d'illustration mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.

Claims

REVENDICATIONS

1. Procédé d’identification de contenu audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée à des utilisateurs ; caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) :

- une étape de collecte (4.1 , 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,

- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source,

- une étape de comparaison (5.4, 5.6) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,

2. Procédé d’identification de contenu audio selon la revendication 1 ; caractérisé en ce que l’étape de comparaison (5.4, 5.6) consiste à comparer des signatures calculées sur les segments émis par chacune des sources.

3. Procédé d’identification de contenu audio selon la revendication 1 ou 2 ; caractérisé en ce que l’étape de comparaison commence par une sous-étape consistant en ce que les segments émis par les sources émettant les flux audio ayant la même dénomination sont comparés entre eux, ladite sous-étape déclenchant une sous-étape d’association (5.5) de cette dénomination avec les identifiants de sources audio émettant le même contenu.

4. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce que l’étape de comparaison (5.4,

5.6) détermine un niveau de similitude entre les contenus, et en ce que l’étape d’association associe également une information représentative de la similitude entre les contenus.

5. Procédé d’identification de contenu audio selon la revendication 4 ; caractérisé en ce que l’étape de comparaison (5.4, 5.6) détecte des redondances de certains contenus à des moments périodiques déterminés, l’étape d’association associe alors également une donnée signifiant le caractère périodique des similitudes des contenus émis par deux sources différentes.

6. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce qu’il comporte les étapes ultérieures suivantes exécutées au niveau d’un récepteur (10) :

- émission (5.9) vers le serveur (1) d’une requête comportant une dénomination d’un flux audio,

- réception en provenance dudit serveur (1) d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié,

- présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux.

7. Procédé d’identification de contenu audio selon les revendications 4 et 6 ; caractérisé en ce que le message transmis au récepteur (10) contient également l’information représentative de la similitude entre les contenus, et en ce que l’étape de présentation de chaque identifiant présente également pour chaque identifiant ladite information représentative de la similitude entre les contenus.

8. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce que des identifiants différents de sources sont associés à des dénominations différentes, ces sources émettant le même contenu audio.

9. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce qu’il comporte une étape d’évaluation de la validité d’au moins deux dénominations associées à un même contenu émis par deux sources différentes, l’étape d’association associant les identifiants de ces sources différentes avec la dénomination ayant la valeur de validité la plus grande.

10. Serveur d’identification (1) de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs ; caractérisé en ce qu’il comporte un moyen de collecte (2, 3, 4, 5) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, un moyen de réception (4, 5) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, un moyen de comparaison (2, 3) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus et une mémoire (7) pour enregistrer les associations des identifiants de sources audio émettant le même contenu avec au moins une dénomination.

11. Récepteur (10) de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs, ledit récepteur comportant des moyens de réception des contenus audio transmis dans le flux et des moyens de reproduction desdits contenus ; caractérisé en ce qu’il comporte en outre un moyen d’émission d’une requête vers un serveur distant contenant une dénomination de contenu afin de recevoir une liste des identifiants de sources audio émettant le contenu identifié par cette dénomination, un moyen d’affichage de la liste reçue et un moyen de sélection d’une des sources affichées afin de lancer la reproduction du contenu émis par cette source.