FR3101451A1 - Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method - Google Patents
Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method Download PDFInfo
- Publication number
- FR3101451A1 FR3101451A1 FR1910617A FR1910617A FR3101451A1 FR 3101451 A1 FR3101451 A1 FR 3101451A1 FR 1910617 A FR1910617 A FR 1910617A FR 1910617 A FR1910617 A FR 1910617A FR 3101451 A1 FR3101451 A1 FR 3101451A1
- Authority
- FR
- France
- Prior art keywords
- sources
- audio
- content
- denomination
- identifiers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000000737 periodic effect Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/38—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space
- H04H60/41—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space for identifying broadcast space, i.e. broadcast channels, broadcast stations or broadcast areas
- H04H60/43—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space for identifying broadcast space, i.e. broadcast channels, broadcast stations or broadcast areas for identifying broadcast channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/30—Aspects of broadcast communication characterised by the use of a return channel, e.g. for collecting users' opinions, for returning broadcast space/time information or for requesting data
- H04H2201/37—Aspects of broadcast communication characterised by the use of a return channel, e.g. for collecting users' opinions, for returning broadcast space/time information or for requesting data via a different channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/90—Aspects of broadcast communication characterised by the use of signatures
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
Procédé d ’identification de flux audio provenant d’une pluralité de sources, système, récepteur et programme associé au procédé L’invention concerne un procédé d’identification de contenu audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée à des utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) : une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison (5.4) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination. De cette manière, il est possible d’identifier chaque flux par son contenu audio et d’effectuer des comparaisons de ce contenu avec d’autres pour générer des associations entre des sources émettant le même contenu. Figure d’abrégé = figure 4Method for identifying audio streams originating from a plurality of sources, system, receiver and program associated with the method The invention relates to a method for identifying audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream. having a denomination presented to users. The method is characterized in that it comprises the following steps executed at the level of a server (1): a step of collecting (4.1, 4.2, 4.3) the identifiers of sources and at least one name associated with the content sent. by each of these sources, a step of receiving (5.2) segments of the audio stream emitted by each of these sources using their source identifiers, a step of comparing (5.4) information representative of the audio content of each segment, in order to determining content identities, a step of associating (5.8) identifiers of audio sources transmitting the same content with at least one denomination. In this way, it is possible to identify each stream by its audio content and to make comparisons of this content with others to generate associations between sources emitting the same content. Abstract figure = figure 4
Description
1. DOMAINE DE L’INVENTION1. FIELD OF THE INVENTION
Le domaine de l’invention est celui de l’identification des contenus audio accessibles par un récepteur capable de recevoir à la fois des contenus d’un réseau de diffusion et d’un réseau bidirectionnel. L’invention concerne plus particulièrement le fait de comparer les signaux audio en provenance des différentes sources et d’établir des identificateurs en fonction des identités et des ressemblances entre les signaux audioThe field of the invention is that of the identification of audio content accessible by a receiver capable of receiving content from both a broadcast network and a two-way network. The invention relates more particularly to the fact of comparing the audio signals originating from the various sources and to establishing identifiers according to the identities and similarities between the audio signals.
2. ARRIÈRE-PLAN TECHNOLOGIQUE2. TECHNOLOGICAL BACKGROUND
Dans le domaine de la diffusion de contenus audio ou audiovisuels, il est connu des récepteurs dits « hybrides » capables de recevoir et de reproduire à la fois des émissions en provenance d’un réseau de diffusion, des contenus transmis à partir d’un site Web, et des contenus transmis en baladodiffusion ou « podcast » selon la terminologie anglo-saxonne. Ces récepteurs sont dotés d’une interface utilisateur comportant un écran et d’un moyen d’introduction de commandes (clavier, écran tactile, reconnaissance vocale, ..), des moyens de réception radio et des moyens d’émission de signaux sonores vers des haut-parleurs. L’utilisateur règle son appareil pour recevoir un contenu diffusé à la radio, ou en provenance d’un site Internet. Certains appareils hybrides peuvent enrichir la réception de contenus audio diffusés par une connexion de type Internet ou « IP », par exemple en améliorant la zone de couverture des contenus diffusés en combinant leurs réceptions traditionnelles par réseau de diffusion selon les normes de diffusion suivantes (liste non limitatives) :In the field of the broadcasting of audio or audiovisual content, so-called "hybrid" receivers capable of receiving and reproducing both broadcasts from a broadcasting network, content transmitted from a site Web, and contents transmitted in podcasting or "podcast" according to the Anglo-Saxon terminology. These receivers are equipped with a user interface comprising a screen and a means for entering commands (keyboard, touch screen, voice recognition, etc.), radio reception means and means for transmitting sound signals to loudspeakers. The user sets his device to receive content broadcast on the radio or from a website. Some hybrid devices can enrich the reception of audio content broadcast by an Internet or "IP" type connection, for example by improving the coverage area of the content broadcast by combining their traditional receptions by broadcasting network according to the following broadcasting standards (list non-limiting):
- FM (Fréquence Modulée) ou AM (modulation d’amplitude),FM (Frequency Modulated) or AM (amplitude modulation),
- DAB (acronyme de Digital Audio Broadcasting »), DAB+,DAB (acronym for Digital Audio Broadcasting"), DAB+,
- DMB,DMB,
- DRM, DRM+,DRM, DRM+,
- DVB (acronyme de Digital Vidéo Broadcasting »), DVB-T (le « T » signifiant « Terrestre »), DVB-S (le « S » signifiant « Satellite»),DVB (acronym for Digital Video Broadcasting"), DVB-T (the "T" stands for "Terrestrial"), DVB-S (the "S" stands for "Satellite"),
- ……
avec des téléchargements ou « streaming » selon la terminologie anglo-saxonne par réseau IP (Wifi, 3G, 4G et 5G dans un futur proche).with downloads or "streaming" according to the Anglo-Saxon terminology by IP network (Wifi, 3G, 4G and 5G in the near future).
Ces différentes sources peuvent fournir le même contenu audio. En effet, il est fréquent qu’une station radio nationale émette des signaux radio en FM à partir d’un réseau terrestre hertzien, des signaux numérique selon le standard DAB (acronyme de « Digital Audio Broadcasting »), et dispose d’un site Web accessible par une adresse IP pour transmettre le contenu audio émis en temps réel. Un utilisateur règle ou programme son récepteur pour recevoir les signaux audio selon l’une quelconque de ces sources pour recevoir le même contenu.These different sources can provide the same audio content. Indeed, it is common for a national radio station to broadcast FM radio signals from a terrestrial hertzian network, digital signals according to the DAB standard (acronym for "Digital Audio Broadcasting"), and has a website Web accessible by an IP address to transmit the audio content transmitted in real time. A user sets or programs his receiver to receive audio signals from any of these sources to receive the same content.
Il est également connu des bases de données qui recensent un grand nombre de sources et fournissent des identifiants pour recevoir tel ou tel programme. Ces bases de données reçoivent en entrée des noms de station d’émission ou de programmes audio, et fournissent des identifiants de stations radio avec les données permettant de recevoir les émissions. Les informations relatives aux stations de radio qu’elles contiennent peuvent être de nature diverse : nom de chaque station, genres, identifiants, logos, localisation géographique, paramètres des émetteurs, programmes du jour ou hebdomadaire, détails de l’émission en cours, URLs de streaming. Ce service est accessible par Internet et l’accès de ces bases est généralement payant.Databases are also known which list a large number of sources and provide identifiers for receiving such and such a program. These databases receive the names of broadcasting stations or audio programs as input, and provide radio station identifiers with the data allowing them to receive the broadcasts. The information relating to the radio stations they contain can be of a diverse nature: name of each station, genres, identifiers, logos, geographical location, parameters of the transmitters, programs of the day or week, details of the current program, URLs streaming. This service is accessible via the Internet and access to these databases is generally chargeable.
Ces bases sont mises à jour par les gestionnaires des stations radio et de façon plus générale par les fournisseurs de contenus audio qui ont intérêt à se faire connaître du public pour ainsi augmenter leur audience. Ces bases reçoivent donc des informations en provenance d’émetteurs certifiés mais ne vérifient pas si les contenus émis par les sources identifiées par les informations reçues correspondent bien aux signaux audio diffusés par ces fournisseurs de contenu. Cette absence de vérification peut entraîner des erreurs dans l’identification des contenus.These databases are updated by radio station managers and more generally by audio content providers who have an interest in making themselves known to the public in order to increase their audience. These databases therefore receive information from certified transmitters but do not check whether the content transmitted by the sources identified by the information received does indeed correspond to the audio signals broadcast by these content providers. This lack of verification may lead to errors in the identification of content.
Tout d’abord, les différentes bases de données sources ne possèdent pas forcément un identifiant commun pour une même radio, chacune de ces bases de données peut identifier un même contenu audio de plusieurs façons différentes. Prenons par exemple, le nom d’une station radio tel que R.T.L., qui est l’acronyme de « Radio Télé Luxembourg », ce nom peut s’écrire soit en majuscule : « RTL », soit en minuscule « rtl », soit séparé par des points « R.T.L. ». Bien que ces trois écritures désignent bien la station de radio dans l’esprit du public, l’informatique considère que ce sont trois identifiants différents.First of all, the different source databases do not necessarily have a common identifier for the same radio, each of these databases can identify the same audio content in several different ways. Take for example, the name of a radio station such as R.T.L., which is an acronym for "Radio Télé Luxembourg", this name can be written either in uppercase: "RTL", or in lowercase "rtl", or separate by dots "R.T.L." ". Although these three spellings identify the radio station well in the public's mind, the computer considers them to be three different identifiers.
L’identifiant d’une même source audio peut également dépendre de la façon de la recevoir, cet identifiant peut par exemple être suffixé par « PI » (signifiant « Program Identifier » qui est un identifiant du système RDS mis en œuvre dans les radio FM) ou par « FM ». De la même façon, une même station de radio peut avoir des URLs différentes dans plusieurs bases.The identifier of the same audio source can also depend on the way of receiving it, this identifier can for example be suffixed by "PI" (meaning "Program Identifier" which is an identifier of the RDS system implemented in FM radio ) or by "FM". Similarly, the same radio station can have different URLs in several databases.
De plus, il arrive que, soit du fait d’erreurs lors de la collecte de ces URLs, soit du fait d’évolution de celles-ci, une URL associée à une station de radio ne soit plus connectée à un flux correspondant à la station de radio à laquelle elle est associée. Du fait d’erreurs informatiques ou humaines, une URL peut pointer vers le flux d’une autre station de radio.Moreover, it happens that, either because of errors during the collection of these URLs, or because of their evolution, a URL associated with a radio station is no longer connected to a stream corresponding to the radio station with which it is associated. Due to computer or human error, a URL may point to another radio station's stream.
Enfin, un fournisseur de contenu peut transmettre des informations pour identifier une certaine source à un certain moment et celles-ci sont ensuite rendues obsolètes. De même, il est possible que les informations transmises soient erronées. De façon générale, les problèmes de cohérence des données entre les bases évoluent dans le temps. Certaines erreurs sont corrigées et d’autres apparaissent à la suite d’une mise à jour par exemple. Il est donc difficile à un instant donné d’être sûr d’introduire le bon identifiant d’une source pour obtenir les moyens de recevoir le flux audio associé.Finally, a content provider can transmit information to identify a certain source at a certain time and this is then rendered obsolete. Likewise, it is possible that the information transmitted is incorrect. In general, data consistency issues between databases change over time. Some errors are corrected and others appear following an update for example. It is therefore difficult at a given moment to be sure to enter the correct identifier of a source to obtain the means of receiving the associated audio stream.
3. OBJECTIFS DE L’INVENTION3. OBJECTIVES OF THE INVENTION
Il existe donc un réel besoin d’un procédé permettant d’associer au moins un identifiant d’une source audio qui est connu des utilisateurs, avec au moins un moyen pour recevoir le flux audio ainsi identifié.There is therefore a real need for a method making it possible to associate at least one identifier of an audio source which is known to the users, with at least one means for receiving the audio stream thus identified.
L’invention propose également un serveur pour récolter des informations sur la disponibilité des flux audio et pour associer des sources émettant le même contenu audio avec au moins une dénomination de ce contenu qui est connue des utilisateurs.The invention also proposes a server for collecting information on the availability of audio streams and for associating sources transmitting the same audio content with at least one denomination of this content which is known to users.
4. PRESENTATION DE L’INVENTION4. PRESENTATION OF THE INVENTION
Dans un mode de réalisation particulier de l’invention, il est proposé un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) :In a particular embodiment of the invention, a method is proposed for identifying audio content emitted by a plurality of identified audio sources, said sources emitting an audio stream having a denomination presented to the users. The method is characterized in that it comprises the following steps executed at the level of a server (1):
- une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,- a step of collecting (4.1, 4.2, 4.3) source identifiers and at least one name associated with the content emitted by each of these sources,
- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source,- a reception step (5.2) of segments of the audio stream emitted by each of these sources using their source identifiers,
- une étape de comparaison (5.4) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,- a comparison step (5.4) of information representative of the audio content of each segment, in order to determine content identities,
- une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination.- a step of association (5.8) of the identifiers of audio sources transmitting the same content with at least one denomination.
Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio, de collecter des informations provenant de diverses bases de données et de les rassembler pour créer des associations pour fournir des identifiants de source lorsqu’un utilisateur désire recevoir un certain contenu.Thus, the proposed solution is based on a completely new and inventive approach, making it possible to identify each stream by its audio content, to collect information from various databases and to bring them together to create associations to provide identifiers of source when a user wishes to receive a certain content.
Selon un premier mode de réalisation, l’étape de comparaison consiste à comparer des signatures calculées sur les segments émis par chacune des sources. De cette manière, la comparaison est facilitée.According to a first embodiment, the comparison step consists in comparing signatures calculated on the segments emitted by each of the sources. In this way, the comparison is facilitated.
Selon un autre mode de réalisation, l’étape de comparaison commence par une sous-étape consistant en ce que les segments émis par les sources émettant les flux audio ayant la même dénomination sont comparés entre eux, ladite sous-étape déclenchant une sous-étape d’association de cette dénomination avec les identifiants de sources audio émettant le même contenu. De cette manière, le procédé compare d’abord les contenus audio ayant la même dénomination et s’ils sont identiques, les identifiants de sources sont alors rassemblés dans une même association, ce qui minimise le temps de traitement.According to another embodiment, the comparison step begins with a sub-step consisting in that the segments transmitted by the sources transmitting the audio streams having the same denomination are compared with each other, said sub-step triggering a sub-step association of this denomination with the identifiers of audio sources transmitting the same content. In this way, the process first compares the audio contents having the same denomination and if they are identical, the source identifiers are then gathered in the same association, which minimizes the processing time.
Selon un autre mode de réalisation, l’étape de comparaison détermine un niveau de similitude entre les contenus, et en ce que l’étape d’association associe également une information représentative de la similitude entre les contenus. De cette manière, les contenus présentant une grande similitude peuvent être facilement rassemblés, et proposés à des fins de reproduction.According to another embodiment, the comparison step determines a level of similarity between the contents, and in that the association step also associates information representative of the similarity between the contents. In this way, content with a high degree of similarity can be easily collected and offered for reproduction.
Selon un autre mode de réalisation, l’étape de comparaison détecte des redondances de certains contenus à des moments périodiques déterminés, l’étape d’association associe alors également une donnée signifiant le caractère périodique des similitudes des contenus émis par deux sources différentes. De cette manière, les utilisateurs peuvent être informés que certaines sources fournissent des contenus identiques sauf à des moments déterminés, ce qui est le cas de station radio nationales et locales.According to another embodiment, the comparison step detects redundancies of certain content at determined periodic times, the association step then also associates data signifying the periodic character of the similarities of the content transmitted by two different sources. In this way, users can be informed that certain sources provide identical content except at specific times, which is the case of national and local radio stations.
Selon un autre mode de réalisation, le procédé d’identification comporte les étapes ultérieures suivantes exécutées au niveau d’un récepteur : émission vers le serveur d’une requête comportant une dénomination d’un flux audio, réception en provenance dudit serveur d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié, présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux. De cette manière, l’utilisateur est ainsi informé des associations et peut choisir la source qui lui convient pour recevoir un certain contenu.According to another embodiment, the identification method comprises the following subsequent steps executed at the level of a receiver: transmission to the server of a request comprising a denomination of an audio stream, reception from said server of a message containing at least one identifier of a source transmitting the identified audio stream, presentation of the at least one identifier on an interface for the purpose of selecting the source to receive said stream. In this way, the user is thus informed of the associations and can choose the source that suits him to receive a certain content.
Selon un autre mode de réalisation, le message transmis au récepteur contient également l’information représentative de la similitude entre les contenus, et en ce que l’étape de présentation de chaque identifiant présente également pour chaque identifiant ladite information représentative de la similitude entre les contenus. De cette manière, l’utilisateur est informé des associations et peut choisir la source qui lui convient pour recevoir un contenu souhaité.According to another embodiment, the message transmitted to the receiver also contains information representative of the similarity between the contents, and in that the step of presenting each identifier also presents for each identifier said information representative of the similarity between the contents. In this way, the user is informed of the associations and can choose the source that suits him to receive a desired content.
Selon un autre mode de réalisation, des identifiants différents de sources sont associés à des dénominations différentes, ces sources émettant le même contenu audio. De cette manière, si un même contenu est accessible sous plusieurs dénominations, il est facile de retrouver les sources qui les émettent.According to another embodiment, different source identifiers are associated with different denominations, these sources transmitting the same audio content. In this way, if the same content is accessible under several denominations, it is easy to find the sources that issue them.
Selon un autre mode de réalisation, le procédé d’identification comporte une étape d’évaluation de la validité d’au moins deux dénominations associées à un même contenu émis par deux sources différentes, l’étape d’association associant les identifiants de ces sources différentes avec la dénomination ayant la valeur de validité la plus grande.According to another embodiment, the identification method comprises a step of evaluating the validity of at least two denominations associated with the same content transmitted by two different sources, the association step associating the identifiers of these sources different with the denomination having the greatest validity value.
L’invention concerne également un serveur d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs. Le serveur comporte un moyen de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, un moyen de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, un moyen de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus et une mémoire pour enregistrer les associations des identifiants de sources audio émettant le même contenu avec au moins une dénomination.The invention also relates to a server for identifying audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a denomination presented at the level of user receivers. The server comprises a means for collecting source identifiers and at least one denomination associated with the content emitted by each of these sources, a means for receiving segments of the audio stream emitted by each of these sources using their source identifiers, means for comparing information representative of the audio content of each segment, in order to determine content identities and a memory for recording the associations of the identifiers of audio sources transmitting the same content with at least one denomination.
L’invention concerne également un récepteur de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs, ledit récepteur comporte des moyens de réception des contenus audio transmis dans le flux, des moyens de reproduction desdits contenus, un moyen d’émission d’une requête vers un serveur distant contenant une dénomination de contenu afin de recevoir une liste des identifiants de sources audio émettant le contenu identifié par cette dénomination, un moyen d’affichage de la liste reçue et un moyen de sélection d’une des sources affichées afin de lancer la reproduction du contenu émis par cette source.The invention also relates to a receiver of audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a denomination presented at the level of user receivers, said receiver comprises means for receiving the audio content transmitted in the stream, means for reproducing said content, means for transmitting a request to a remote server containing a content denomination in order to receive a list of identifiers of audio sources transmitting the content identified by this denomination, display means from the list received and means for selecting one of the sources displayed in order to launch the reproduction of the content emitted by this source.
5. DESCRIPTION DES FIGURES5. DESCRIPTION OF FIGURES
D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description suivante, donnée à titre d’exemple indicatif et non limitatif, et des dessins annexés, dans lesquels :Other characteristics and advantages of the invention will appear on reading the following description, given by way of indicative and non-limiting example, and the appended drawings, in which:
-
-
-
-
-
6. DESCRIPTION DETAILLEE D’UN MODE DE REALISATION6. DETAILED DESCRIPTION OF AN EMBODIMENT
L’invention concerne un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur : une étape de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, et une étape d’association des identifiants de sources audio émettant le même contenu avec au moins une dénomination. Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio et d’effectuer des comparaisons de ce contenu avec d’autres contenus pour générer des associations entre des sources émettant le même contenu.The invention relates to a method for identifying audio content emitted by a plurality of identified audio sources, said sources emitting an audio stream having a denomination presented to the users. The method is characterized in that it comprises the following steps executed at the level of a server: a step for collecting source identifiers and at least one denomination associated with the content emitted by each of these sources, a step for receiving of segments of the audio stream emitted by each of these sources using their source identifiers, a step of comparing information representative of the audio content of each segment, in order to determine content identities, and a step of associating the identifiers of audio sources emitting the same content with at least one denomination. Thus, the proposed solution is based on an entirely new and inventive approach, making it possible to identify each stream by its audio content and to make comparisons of this content with other content to generate associations between sources emitting the same content.
6.2 Description d’un mode particulier de réalisation6.2 Description of a particular embodiment
Sur toutes les figures du présent document, les éléments (ou les étapes) identiques sont désignées par une même référence numérique.In all the figures of this document, identical elements (or steps) are designated by the same reference numeral.
On présente maintenant, en relation avec lafig. 1, une structure d’un serveur 1, selon un mode de réalisation particulier de l'invention. Ce serveur constitue une plateforme de service accessible par un réseau, Internet par exemple, pour obtenir des moyens de réception d’un flux audio déterminé. Ce flux audio est constitué d’une succession de paquets de données émis par une certaine source, la charge utile des paquets contenant des signaux sonores pour produire un son au niveau d’un récepteur et le faire entendre à des utilisateurs. Une source audio est identifiée par un identifiant qui dépend du type de source, si les signaux proviennent d’une station radio FM alors l’identifiant peut être une fréquence porteuse, si les signaux proviennent d’un site informatique, l’identifiant est généralement une URL.We now present, in relation to FIG. 1 , a structure of a server 1, according to a particular embodiment of the invention. This server constitutes a service platform accessible by a network, the Internet for example, to obtain means for receiving a determined audio stream. This audio stream consists of a succession of data packets emitted by a certain source, the payload of the packets containing sound signals to produce a sound at the level of a receiver and make it heard by users. An audio source is identified by an identifier which depends on the type of source, if the signals come from an FM radio station then the identifier can be a carrier frequency, if the signals come from a computer site, the identifier is generally a URL.
Le serveur 1 comporte typiquement une unité centrale 2 associée à une mémoire de programme 3, un module de réception d’un flux radio 4 recevant des émissions d’un réseau de diffusion monodirectionnel, un réseau FM par exemple, et un module de communication 5 pour des communications bidirectionnelles à l’aide d’un câble. Dans un cas très particulier, où le serveur 1 est directement accessible par un opérateur, il dispose alors de moyens d’entrée/sortie local 6 pour une connexion avec un terminal et/ou une imprimante. Le récepteur dispose également d’une mémoire 7 capable de stocker des données en provenance de l’un quelconque des moyens de réception unidirectionnel ou bidirectionnel et pour mémoriser des données d’associations entre des sources audio et des dénominations de contenus.The server 1 typically comprises a central unit 2 associated with a program memory 3, a module for receiving a radio stream 4 receiving emissions from a one-way broadcasting network, an FM network for example, and a communication module 5 for two-way communications using a cable. In a very particular case, where the server 1 is directly accessible by an operator, it then has local input/output means 6 for a connection with a terminal and/or a printer. The receiver also has a memory 7 capable of storing data coming from any one of the unidirectional or bidirectional reception means and of storing association data between audio sources and content denominations.
LaFig. 2illustre les principaux composants d’un appareil récepteur 10, selon un mode de réalisation particulier de l'invention. Le récepteur 10 comporte typiquement une unité centrale 11 associée à une mémoire de programme 12, un module de réception d’un flux radio 13 recevant des émissions d’un réseau monodirectionnel, un réseau FM par exemple, et un module de communication 14 autorisant des communications bidirectionnelles à courte ou à longue portée par un câble ou par la radio, en utilisant par exemple le réseau Bluetooth, Wifi et/ou GSM. Le récepteur dispose également de moyens d’introduction de commande 15 (clavier, boutons, écran tactile, …), et de moyens d’affichage 16 (écran, voyants lumineux, synthèse vocale, …). Ces moyens peuvent être intégrés à l’appareil ou déportés. L’appareil dispose également d’un moyen de reproduction d’un contenu audio, composé par exemple d’un écran déporté, et/ou d’un amplificateur 17 intégré à l’appareil émettant des signaux acoustiques vers des haut-parleurs déportés 18. Selon un perfectionnement non obligatoire, le récepteur 10 dispose également d’une mémoire 19 capable de stocker un contenu audio et/ou visuel diffusé par un réseau unidirectionnel ou bidirectionnel. Fig. 2 illustrates the main components of a receiver device 10, according to a particular embodiment of the invention. The receiver 10 typically comprises a central unit 11 associated with a program memory 12, a module for receiving a radio stream 13 receiving transmissions from a one-way network, an FM network for example, and a communication module 14 authorizing two-way communications at short or long range by cable or by radio, using for example the Bluetooth, Wifi and/or GSM network. The receiver also has command input means 15 (keyboard, buttons, touch screen, etc.), and display means 16 (screen, indicator lights, voice synthesis, etc.). These means can be integrated into the device or remote. The device also has a means of reproducing audio content, composed for example of a remote screen, and/or an amplifier 17 integrated into the device emitting acoustic signals to remote speakers 18 According to a non-mandatory improvement, the receiver 10 also has a memory 19 capable of storing audio and/or visual content broadcast by a unidirectional or bidirectional network.
Le récepteur 10 reçoit une alimentation électrique ou dispose de sa propre batterie. Il peut être mobile et prendre l’aspect d’un téléphone portable intelligent (ou « smartphone » selon la terminologie anglo-saxonne. Il peut par exemple être embarqué dans un véhicule itinérant, le récepteur est alors un autoradio.The receiver 10 receives an electrical power supply or has its own battery. It can be mobile and take on the appearance of a smart mobile phone (or "smartphone" according to Anglo-Saxon terminology. It can for example be embedded in a traveling vehicle, the receiver is then a car radio.
Le récepteur permet de recevoir un flux audio d’une source distante. L’utilisateur introduit une dénomination d’un contenu audio et le récepteur émet une requête vers le serveur 1 pour recevoir au moins un identifiant d’une source émettant le flux de ce contenu audio.The receiver allows you to receive an audio stream from a remote source. The user introduces a denomination of an audio content and the receiver sends a request to the server 1 to receive at least one identifier of a source transmitting the stream of this audio content.
Après avoir détaillé les principaux dispositifs permettant de mettre en œuvre le procédé, nous allons maintenant expliquer comment ceux-ci coopèrent.After having detailed the main devices making it possible to implement the method, we will now explain how these cooperate.
LaFig. 3présente un schéma général du traitement des données afin de produire des associations de contenus et de sources audio. Un serveur 30 dit « Data updater » est chargé de collecter des données provenant d’une pluralité de sources différentes 31, 32. Les données collectées associent un certain identifiant de contenu audio avec une source. Les données collectées sont rassemblées dans une mémoire 33 dites de « données brutes ». A un certain moment, un module d’analyse 34 est exécuté afin de lire ces données, de les convertir en signaux audio et de les transmettre à un module de comparaison 35 de ces signaux audio afin d’en déterminer les similitudes, les différences et les identités. Fig. 3 presents a general diagram of data processing in order to produce associations of content and audio sources. A so-called “Data updater” server 30 is responsible for collecting data from a plurality of different sources 31, 32. The data collected associates a certain audio content identifier with a source. The collected data is gathered in a so-called “raw data” memory 33 . At a certain moment, an analysis module 34 is executed in order to read these data, to convert them into audio signals and to transmit them to a comparison module 35 of these audio signals in order to determine the similarities, the differences and the identities.
Les modules d’analyse 34 et de comparaison 35 produisent des données validées consistant en une liste d’associations de dénominations de contenus avec des identifiants de sources audio de différents types permettant à des récepteurs 10 de recevoir ces contenus audio.The analysis 34 and comparison 35 modules produce validated data consisting of a list of associations of content denominations with identifiers of audio sources of different types allowing receivers 10 to receive these audio contents.
Nous allons maintenant détailler plus spécifiquement les différentes opérations permettant de produire les données validées.We will now detail more specifically the different operations used to produce the validated data.
6.3 Phase de recherche d’informations6.3 Information research phase
Selon une première phase de recherche d’informations, qui est illustrée par laFig. 4, les données relatives à des identifiants de sources audio vont être rassemblées dans une base de données dites « brutes », en ce sens qu’elles sont mémorisées sans traitement préalable. Le serveur 1 collecte des données en permanence et de façon cyclique, la durée de chaque cycle dépendant du nombre de stations radio à scanner, et des bases de données à interroger.According to a first information search phase, which is illustrated by FIG. 4 , the data relating to audio source identifiers will be collected in a so-called “raw” database, in the sense that they are stored without prior processing. The server 1 collects data continuously and cyclically, the duration of each cycle depending on the number of radio stations to be scanned, and the databases to be interrogated.
Selon une étape 4.1, le serveur 1 émet des requêtes à destination des bases de données publiques ou privées, dans le but de recevoir de ces bases des associations d’identifiants et de moyens de réception. Le serveur réceptionne les données d’associations et les enregistre dans la mémoire 7.According to a step 4.1, the server 1 sends requests to public or private databases, with the aim of receiving associations of identifiers and reception means from these databases. The server receives the association data and saves it in memory 7.
Selon une autre étape 4.2, le serveur 1 scanne les fréquences FM en vue de découvrir les stations radio qui diffusent actuellement des contenus audio. L’identité de la station émettrice peut être déterminée en utilisant le système R.D.S. qui consiste à incorporer dans les signaux radio l’identifiant de la station. Une autre façon de faire consiste à analyser les signaux audio de façon à détecter des jingles qui sont très souvent caractéristiques de la station, ces jingles peuvent être uniquement musicaux, ou contenir le nom de la station. Après chaque scan des fréquences, le serveur enregistre dans la mémoire 7 des associations entre un nom de station émettrice et une fréquence donnée.According to another step 4.2, the server 1 scans the FM frequencies with a view to discovering the radio stations which are currently broadcasting audio content. The identity of the transmitting station can be determined using the R.D.S. which consists in incorporating the identifier of the station into the radio signals. Another way of proceeding consists in analyzing the audio signals so as to detect jingles which are very often characteristic of the station, these jingles can be only musical, or contain the name of the station. After each scan of the frequencies, the server stores in the memory 7 associations between a transmitting station name and a given frequency.
Selon une autre étape 4.3, le serveur interroge des sites déjà référencés et qui sont censés émettre des signaux audio en continu. Un segment audio d’une courte durée peut être enregistré dans la mémoire à des fins de vérification de l’identification.According to another step 4.3, the server interrogates sites already referenced and which are supposed to transmit audio signals continuously. A short audio segment may be stored in memory for identification verification purposes.
Ces trois étapes peuvent se dérouler en même temps puisqu’elles peuvent utiliser des ressources matérielles différentes. A la fin de chaque cycle de collecte, la mémoire 7 contient des données brutes qui sont ensuite exploitées pour générer des listes vérifiées associant au moins une dénomination d’un contenu audio avec des identifiants de sources audio (étape 4.4).These three steps can take place at the same time since they can use different material resources. At the end of each collection cycle, memory 7 contains raw data which is then used to generate verified lists associating at least one denomination of audio content with identifiers of audio sources (step 4.4).
6.4 Phase de traitement des informations récoltées6.4 Processing phase of the information collected
Le traitement des données brutes est schématisé par l’ordinogramme de laFig. 5. L’ensemble des identifiants de sources audio enregistrés dans la mémoire 7 sont comparés les uns aux autres afin de détecter des identités. A l’étape 5.1, le serveur recherche les associations ayant les mêmes dénominations de flux audio et les mêmes identifiants de sources audio. Dans ce cas, il est inutile de maintenir des associations en double, et les deux associations sont réduites à une seule. Le serveur calcule ensuite les signatures des signaux audio émis par toutes les sources identifiées dans la base de données brutes (étape 5.2), ce calcul s’effectue globalement pour tous les signaux au cours d’une certain laps de temps, ou en tant que tache de fond. Le calcul peut aussi s’effectuer ponctuellement lorsque le traitement a besoin de calculer la signature d’un contenu. Le calcul de signature s’effectue en recevant le contenu audio émis par une source identifiée (en se connectant à une adresse IP, ou en réglant le moyen de réception radio 4 avec la fréquence identifiée) et en utilisant les données reçues dans le flux.The processing of the raw data is schematized by the flowchart of FIG. 5 . All of the audio source identifiers recorded in the memory 7 are compared with each other in order to detect identities. In step 5.1, the server searches for the associations having the same audio stream names and the same audio source identifiers. In this case, there is no need to maintain duplicate associations, and the two associations are reduced to one. The server then calculates the signatures of the audio signals emitted by all the sources identified in the raw database (step 5.2), this calculation is carried out globally for all the signals during a certain period of time, or as background process. The calculation can also be performed punctually when the processing needs to calculate the signature of a content. The signature calculation is performed by receiving the audio content transmitted by an identified source (by connecting to an IP address, or by adjusting the radio reception means 4 with the identified frequency) and by using the data received in the stream.
A l’étape 5.3, le serveur recherche des associations comportant les mêmes dénominations de flux audio et des identifiants de source différents. Le serveur vérifie alors en les comparant si les contenus audio émis par les sources ainsi identifiées sont identiques (étape 5.4). Pour cela, le serveur utilise un module de comparaison de signaux audio qui est une technique connue en soi. Le brevet n° EP 1 741 047 déposé par la demanderesse le 18 Mars 2005 décrit un procédé utilisant une signature de signaux audio afin de déterminer les ressemblances, les différences et les similitudes de deux flux audio. Si à l’issue de cette comparaison, les contenus audio sont les mêmes, alors on peut déduire qu’il ne forme qu’un et que ce dernier est accessible selon au moins deux sources. Dans ce cas, le serveur crée une association entre cet identifiant et les deux sources découvertes, et enregistre cette association dans une partie dédiée de la mémoire 7 (étape 5.5). Chaque fois que, dans les données brutes, le serveur détermine que le même contenu audio désigné par le même identifiant, est transmis par des sources différentes, il associe alors l’ensemble des sources à cet identifiant.In step 5.3, the server searches for associations comprising the same audio stream denominations and different source identifiers. The server then checks by comparing them whether the audio contents emitted by the sources thus identified are identical (step 5.4). For this, the server uses an audio signal comparison module which is a technique known per se. Patent No. EP 1,741,047 filed by the applicant on March 18, 2005 describes a method using an audio signal signature to determine the similarities, differences and similarities of two audio streams. If at the end of this comparison, the audio content is the same, then we can deduce that it is one and that it is accessible from at least two sources. In this case, the server creates an association between this identifier and the two sources discovered, and saves this association in a dedicated part of the memory 7 (step 5.5). Whenever, in the raw data, the server determines that the same audio content designated by the same identifier is transmitted by different sources, it then associates all the sources with this identifier.
Si par contre les contenus audio ne sont pas les mêmes, alors une des deux dénominations peut être erronée. Dans ce cas et selon une première stratégie, le serveur recherche dans le flux des informations sur la dénomination du contenu audio émis. Ces informations peuvent être des données spécifiques de type RDS émises dans un flux unidirectionnel, ou des données récurrentes émises toutes les heures et caractéristiques d’un certain contenu audio. Par exemple, certaines stations radio émettent à chaque changement d’heure un jingle qui est reconnaissable et spécifique à la station. Le serveur peut disposer d’une bibliothèque de jingles permettant de mieux identifier des contenus audio. Selon une seconde stratégie, le serveur compare les signaux audio d’un contenu avec les signaux audio des autres contenus accessibles par les données brutes enregistrées dans la mémoire (étape 5.6). Si un autre contenu est trouvé, alors il est possible de rectifier la dénomination du premier contenu en utilisant le second. La correction d’une dénomination est habituellement basée sur un indice de confiance, cet indice est maximal lorsque la dénomination est extraite d’un flux (par des signaux RDS par exemple). Si la dénomination n’est pas lisible dans les signaux, l’indice peut être proportionnel au nombre d’associations entre un même contenu et un même identifiant de source. Si par exemple, un même contenu audio est accessible selon cinq sources différentes et qu’il est dénommé quatre fois selon une première dénomination et une autre fois avec une autre, la première dénomination est clairement la plus plausible. Dans ce cas, et selon une première variante, le serveur considère que la dénomination la moins plausible est erronée, elle doit être supprimée et remplacée par la dénomination la plus plausible. Selon une seconde variante, le serveur agglomère toutes les dénominations dans une liste, qui est associée à la liste de tous les identifiants de source. Si un récepteur émet vers le serveur 1 une requête de réception en transmettant une dénomination d’un contenu, il recevra la liste de tous les identifiants de source associés à cette dénomination. Selon un perfectionnement, l’indice de confiance associé à chaque dénomination est également transmis, de cette façon l’utilisateur peut se rendre compte de la dénomination la plus sûre pour désigner ce contenu.If, on the other hand, the audio contents are not the same, then one of the two denominations may be incorrect. In this case and according to a first strategy, the server searches the stream for information on the denomination of the transmitted audio content. This information can be specific RDS type data sent in a unidirectional stream, or recurring data sent every hour and characteristic of certain audio content. For example, some radio stations play a jingle every time the clock changes that is recognizable and specific to the station. The server may have a library of jingles to better identify audio content. According to a second strategy, the server compares the audio signals of a content with the audio signals of the other contents accessible by the raw data recorded in the memory (step 5.6). If another content is found, then it is possible to rectify the denomination of the first content by using the second. The correction of a denomination is usually based on a confidence index, this index is maximum when the denomination is extracted from a stream (by RDS signals for example). If the denomination is not readable in the signals, the index can be proportional to the number of associations between the same content and the same source identifier. If, for example, the same audio content is accessible from five different sources and it is named four times according to a first name and another time with another, the first name is clearly the most plausible. In this case, and according to a first variant, the server considers that the least plausible denomination is erroneous, it must be deleted and replaced by the most plausible denomination. According to a second variant, the server aggregates all the denominations in a list, which is associated with the list of all the source identifiers. If a receiver sends a reception request to server 1 by transmitting a denomination of a content, it will receive the list of all the source identifiers associated with this denomination. According to an improvement, the confidence index associated with each denomination is also transmitted, in this way the user can find out which denomination is the safest to designate this content.
L’étape 5.6 compare également les données des flux dont les identifiants n’ont été recensés qu’une seule fois, ces flux sont dits « unitaires ». Si à l’étape 5.6, la dénomination d’un contenu n’a été trouvée qu’une seule fois dans les recherches effectuées au cours des étapes 4.1, 4.2 et 4.3, et que ce contenu est identique à celui émis par une autre source sous une autre dénomination, alors les deux dénominations ainsi que les deux identifiants de ces deux sources sont agglomérés et référencés dans une même association (étape 5.5). Prenons par exemple la station radio RTL qui émet des ondes radio sur la fréquence porteuse de 104,3 Mhz et supposons que le contenu de cette radio est également accessible sous la dénomination « R.T.L. » à l’adresse URL_1, alors le serveur 1 produit l’association ci-dessous et la mémorise dans la partie dédiée de la mémoire 7 :Step 5.6 also compares the data of the flows whose identifiers have been listed only once, these flows are said to be "unitary". If in step 5.6, the name of a content was found only once in the searches carried out during steps 4.1, 4.2 and 4.3, and this content is identical to that issued by another source under another denomination, then the two denominations as well as the two identifiers of these two sources are agglomerated and referenced in the same association (step 5.5). Take for example the radio station RTL which transmits radio waves on the carrier frequency of 104.3 Mhz and suppose that the content of this radio is also accessible under the name “R.T.L. to URL_1, then server 1 produces the association below and stores it in the dedicated part of memory 7:
[RTL ou R.T.L. / 104,3 MHz ou URL_1][RTL or R.T.L. / 104.3 MHz or URL_1]
Si plus tard, un récepteur demande une source fournissant le contenu de cette station radio, la requête pourra indifféremment contenir « RTL » ou « R.T.L. », et la réponse contiendra au moins l’ensemble des identifiants de sources : 104,3 MHz ou URL_1. De cette manière, un utilisateur d’un tel récepteur pourra choisir qu’elle est la source qu’il désire utiliser pour recevoir ce contenu. S’il sait que son récepteur dispose d’un faible débit par son réseau de communication filaire, il peut choisir le flux radio. Par contre, s’il sait que les conditions radio ne sont pas bonnes, il pourra privilégier le réseau filaire.If later a receiver requests a source providing content from that radio station, the request may either contain "RTL" or "R.T.L." and the response will contain at least the full set of source IDs: 104.3 MHz or URL_1. In this way, a user of such a receiver can choose which source he wishes to use to receive this content. If he knows that his receiver has a low throughput via his wired communication network, he can choose the radio stream. On the other hand, if he knows that the radio conditions are not good, he can favor the wired network.
Si par contre, le contenu analysé n’est identique à aucun autre, aucune autre association ne sera produite et les données de ce contenu enregistrées dans la mémoire dédiée resteront les mêmes que les données brutes. Il ne sera possible d’accéder à ce contenu que par un seul moyen (étape 5.7).If, on the other hand, the analyzed content is not identical to any other, no other association will be produced and the data of this content recorded in the dedicated memory will remain the same as the raw data. It will only be possible to access this content by one means (step 5.7).
A l’issue des étapes 5.5, 5.6 et 5.7, les associations d’identifiants et de dénominations de sources sont rassemblées dans une même base de données dites dédiée, qui est enregistrée dans la mémoire 7 du serveur 1 (étape 5.8). A l’étape 5.9, un utilisateur peut utiliser son récepteur 10 pour accéder au serveur 1 et lui demander par une requête contenant au moins une dénomination de contenu au moins un identifiant d’une source pour recevoir ce contenu. Le serveur 1 lit alors dans sa mémoire 7 et recherche les associations contenant la dénomination indiquée, il renvoie alors les identifiants associés. Le récepteur 1 présente les données transmises dans un menu affiché à l’écran 16. Ce menu fait apparaître la liste des identifiants de source, mais aussi les autres dénominations désignant le même contenu audio. L’utilisateur sélectionne alors un des identifiants de source affichés, ce qui déclenche la connexion à cette source et la réception au niveau du récepteur du contenu demandé.At the end of steps 5.5, 5.6 and 5.7, the associations of source identifiers and denominations are collected in the same so-called dedicated database, which is recorded in the memory 7 of the server 1 (step 5.8). In step 5.9, a user can use his receiver 10 to access the server 1 and ask it by a request containing at least one content name at least one identifier of a source to receive this content. The server 1 then reads in its memory 7 and searches for the associations containing the denomination indicated, it then returns the associated identifiers. Receiver 1 presents the data transmitted in a menu displayed on screen 16. This menu displays the list of source identifiers, but also the other denominations designating the same audio content. The user then selects one of the source identifiers displayed, which triggers the connection to this source and the reception at the level of the receiver of the requested content.
Une fois que toutes les signatures ont été comparées au moins une fois avec une autre signature, et que toutes les associations ont été mémorisées dans la mémoire dédiée, le serveur repart pour un nouveau traitement, en utilisant de nouveaux segments. De cette manière, la liste des associations est constamment mise à jour.Once all the signatures have been compared at least once with another signature, and all the associations have been stored in the dedicated memory, the server restarts for a new processing, using new segments. In this way, the list of associations is constantly updated.
Il s’avère que de nombreux contenus sont émis par au moins deux sources, il est donc avantageux de profiter de ces identités pour regrouper ces sources de façon à réduire le nombre des comparaisons. Le déroulement d’étapes décrit ci-dessus permet de réduire le nombre de contenus à comparer et donc le nombre de signature, en regroupant les sources qui émettent le même contenu. Le déroulement d’étapes permet également de vérifier l’exactitude des identifiants de source et des dénominations.It turns out that many contents are issued by at least two sources, so it is advantageous to take advantage of these identities to group these sources in order to reduce the number of comparisons. The sequence of steps described above makes it possible to reduce the number of contents to be compared and therefore the number of signatures, by grouping the sources which emit the same content. The sequence of steps also makes it possible to verify the accuracy of source identifiers and denominations.
6.5 Détermination de similitudes entre les signatures6.5 Determination of similarities between signatures
Dans certains cas, les modules de comparaison de signatures deux à deux, qui sont mis en œuvre lors des étapes 5.4 et 5.6, fournissent trois résultats :In some cases, the two-by-two signature comparison modules, which are implemented in steps 5.4 and 5.6, provide three results:
- les signatures sont parfaitement identiques,the signatures are perfectly identical,
- les signatures sont partiellement identiques,the signatures are partially identical,
- les signatures sont complètement différentes.the signatures are completely different.
Les signatures sont partiellement identiques lorsque par exemple, les deux contenus sont fournis par une station de diffusion nationale et par une station locale. Dans un tel cas, la plupart du temps, les contenus sont identiques mais à certaines heures, le contenu national est remplacé par un contenu local, par exemple un journal régional, ou un reportage sur une activité locale. Selon un autre exemple, la station émet des séquences publicitaires au cours de plages temporelles dédiées, le contenu de ces plages est modifié pour être remplacé par un contenu plus adapté localement. Le module de comparaison de signatures détecte une grande similitude entre les données et peut déterminer qu’au cours d’un grand laps de temps, les signaux sonores sont identiques.The signatures are partially identical when, for example, the two contents are provided by a national broadcasting station and by a local station. In such a case, most of the time, the contents are identical but at certain times, the national content is replaced by local content, for example a regional newspaper, or a report on a local activity. According to another example, the station transmits advertising sequences during dedicated time slots, the content of these slots is modified to be replaced by more locally adapted content. The signature comparison module detects a high similarity between the data and can determine that over a large period of time the sound signals are identical.
Selon la présente invention, si les signatures sont parfaitement identiques, alors les contenus sont identiques et les sources associées émettent le même contenu audio. Ces sources sont associées avec le ou les mêmes dénomination(s) de contenu.According to the present invention, if the signatures are perfectly identical, then the contents are identical and the associated sources transmit the same audio content. These sources are associated with the same content name(s).
Si les signatures sont partiellement identiques, un module de vérification détecte les redondances entre les identités et les différences de contenus. Si les différences interviennent aléatoirement, il peut s’agir d’événements dus à une mauvaise réception et/ou à la présence de parasites, ou encore le fruit du hasard. C’est le cas par exemple de deux stations radio différentes qui diffusent la même chanson quasiment au même moment. Dans ce cas, le module de vérification considère que ce sont deux contenus différents. Si par contre les redondances sont nombreuses et les différences apparaissent très régulièrement et pendant une période constante d’une fois sur l’autre, alors on peut considérer qu’un des contenus est une déclinaison de l’autre. Dans ce cas, les deux sources, et éventuellement les deux dénominations (si elles sont différentes, par exemple des noms de stations comportant le nom de la région de diffusion) sont enregistrées dans la mémoire dédiée selon la même association. Une indication est rajoutée pour indiquer que les contenus sont identiques sauf à certains moments. De cette façon, un utilisateur peut être averti qu’il peut recevoir plusieurs déclinaisons locales d’une même station radio nationale, et peut éventuellement sélectionner des contenus qui ne correspondent pas à sa région.If the signatures are partially identical, a verification module detects the redundancies between the identities and the content differences. If the differences occur randomly, they may be events due to poor reception and/or the presence of interference, or even the result of chance. This is the case, for example, of two different radio stations broadcasting the same song at almost the same time. In this case, the verification module considers that these are two different contents. If, on the other hand, the redundancies are numerous and the differences appear very regularly and for a constant period from one time to the next, then we can consider that one of the contents is a variation of the other. In this case, the two sources, and possibly the two denominations (if they are different, for example names of stations comprising the name of the broadcasting region) are recorded in the dedicated memory according to the same association. An indication is added to indicate that the contents are identical except at certain times. In this way, a user can be warned that he can receive several local variations of the same national radio station, and can possibly select content that does not correspond to his region.
Le module de vérification analyse les contenus au cours d’une période de temps assez longue, de l’ordre de 12h ou de 24 heures, en commençant de préférence à un moment particulier, à 00h00 par exemple.The verification module analyzes the content over a fairly long period of time, of the order of 12 or 24 hours, preferably starting at a particular time, at 00:00 for example.
Selon un perfectionnement, le procédé utilise un module d’évaluation des similitudes entre des dénominations, ce module détermine à l’étape 5.4 que les dénominations sont similaires et les traite comme si elles sont identiques. C’est le cas par exemple lorsque les dénominations sont écrites l’une en majuscule, et l’autre en minuscule, ou encore lorsqu’une faute d’orthographe s’est glissée dans l’une des dénominations.According to an improvement, the method uses a module for evaluating the similarities between denominations, this module determines in step 5.4 that the denominations are similar and treats them as if they are identical. This is the case, for example, when the denominations are written one in uppercase and the other in lowercase, or when a spelling error has slipped into one of the denominations.
Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation doivent être considérés à titre d'illustration mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.It should be apparent to those skilled in the art that the present invention permits embodiments in many other specific forms without departing from the scope of the invention as claimed. Accordingly, the present embodiments are to be considered illustrative but may be modified within the scope defined by the scope of the appended claims.
Claims (11)
- une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,
- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source,
- une étape de comparaison (5.4, 5.6) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,
- une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination.A method of identifying audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a denomination presented to users; characterized in that it comprises the following steps executed at the level of a server (1):
- a step of collecting (4.1, 4.2, 4.3) source identifiers and at least one denomination associated with the content emitted by each of these sources,
- a reception step (5.2) of segments of the audio stream emitted by each of these sources using their source identifiers,
- a comparison step (5.4, 5.6) of information representative of the audio content of each segment, in order to determine content identities,
- a step of association (5.8) of the identifiers of audio sources transmitting the same content with at least one denomination.
- émission (5.9) vers le serveur (1) d’une requête comportant une dénomination d’un flux audio,
- réception en provenance dudit serveur (1) d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié,
- présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux.A method of identifying audio content according to any one of the preceding claims; characterized in that it comprises the following subsequent steps executed at the level of a receiver (10):
- transmission (5.9) to the server (1) of a request comprising a denomination of an audio stream,
- reception from said server (1) of a message containing at least one identifier of a source transmitting the identified audio stream,
- presentation of at least one identifier on an interface for the purpose of selecting the source to receive said stream.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1910617A FR3101451B1 (en) | 2019-09-26 | 2019-09-26 | Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method |
PCT/EP2020/076072 WO2021058384A1 (en) | 2019-09-26 | 2020-09-18 | Method for identifying an audio stream originating from a plurality of sources and system, receiver and program associated with the method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1910617 | 2019-09-26 | ||
FR1910617A FR3101451B1 (en) | 2019-09-26 | 2019-09-26 | Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3101451A1 true FR3101451A1 (en) | 2021-04-02 |
FR3101451B1 FR3101451B1 (en) | 2021-10-01 |
Family
ID=69375451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1910617A Active FR3101451B1 (en) | 2019-09-26 | 2019-09-26 | Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR3101451B1 (en) |
WO (1) | WO2021058384A1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001088900A2 (en) * | 2000-05-15 | 2001-11-22 | Creative Technology Ltd. | Process for identifying audio content |
EP1741047A2 (en) | 2004-04-05 | 2007-01-10 | Lebrat, François | Method for searching content particularly for extracts common to two computer files |
US20170019196A1 (en) * | 2011-08-30 | 2017-01-19 | Iheartmedia Management Services, Inc. | Identification of changed broadcast media items |
WO2017064400A1 (en) * | 2015-10-12 | 2017-04-20 | Tdf | Contextual enrichment by audio recognition |
EP3373485A1 (en) * | 2017-03-10 | 2018-09-12 | Alps Electric Co., Ltd. | Broadcast receiving apparatus, control method therefor, and control program therefor |
-
2019
- 2019-09-26 FR FR1910617A patent/FR3101451B1/en active Active
-
2020
- 2020-09-18 WO PCT/EP2020/076072 patent/WO2021058384A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001088900A2 (en) * | 2000-05-15 | 2001-11-22 | Creative Technology Ltd. | Process for identifying audio content |
EP1741047A2 (en) | 2004-04-05 | 2007-01-10 | Lebrat, François | Method for searching content particularly for extracts common to two computer files |
US20170019196A1 (en) * | 2011-08-30 | 2017-01-19 | Iheartmedia Management Services, Inc. | Identification of changed broadcast media items |
WO2017064400A1 (en) * | 2015-10-12 | 2017-04-20 | Tdf | Contextual enrichment by audio recognition |
EP3373485A1 (en) * | 2017-03-10 | 2018-09-12 | Alps Electric Co., Ltd. | Broadcast receiving apparatus, control method therefor, and control program therefor |
Also Published As
Publication number | Publication date |
---|---|
WO2021058384A1 (en) | 2021-04-01 |
FR3101451B1 (en) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11133882B2 (en) | Content selection based on simulcast data | |
US9026546B2 (en) | Discovery of music artist and title by a radio station connection to an acoustic fingerprinting service provider | |
US8401580B2 (en) | Processing simulcast data | |
US7778591B1 (en) | Radio with backchannel feedback | |
US11062331B2 (en) | Determining streaming content user consumption | |
AU2012254217B2 (en) | System and method for recognizing broadcast program content | |
US20160239571A1 (en) | Systems and methods for content selection based on search query correlation with broadcast media | |
WO2019002359A1 (en) | Method for transmitting interrupted audio content in a hybrid receiver, system, receiver, and program associated with said method | |
US20160182172A1 (en) | Data communication with acoustic signal communication | |
US10009451B2 (en) | Radio locator application | |
US10320502B2 (en) | Audio capture | |
FR3101451A1 (en) | Method for identifying audio streams from a plurality of sources, system, receiver and program associated with the method | |
JP2007043474A (en) | Content acquisition system, broadcast receiver, content providing system, and content acquisition method | |
US10283128B2 (en) | Coded acoustic signal communication with separate code-associated data communication | |
WO2020260637A1 (en) | Method for transmitting audio content to a hybrid receiver by receiving manifests generated by a manager server, receiver and associated manager server | |
EP3391622B1 (en) | Geolocation-based parameterisation for the broadcasting of multimedia content | |
FR2715016A1 (en) | Television and radio audience measurement method | |
WO2017064400A1 (en) | Contextual enrichment by audio recognition | |
JP2011049896A (en) | Broadcast receiver, ranking information provision server, system, control method, and program | |
FR2863805A1 (en) | Digital image enrichment method, involves receiving contextual data transmitted by data broadcasting transmitters and associating contextual data with image data relative to images captured by camera in utilization environment | |
US20150304058A1 (en) | System and method to provide the ability to the plurality of users to broadcast their plurality of personalized contents to their preferred device and preferred language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20210402 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
PLFP | Fee payment |
Year of fee payment: 6 |