WO2021058384A1 - Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé - Google Patents

Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé Download PDF

Info

Publication number
WO2021058384A1
WO2021058384A1 PCT/EP2020/076072 EP2020076072W WO2021058384A1 WO 2021058384 A1 WO2021058384 A1 WO 2021058384A1 EP 2020076072 W EP2020076072 W EP 2020076072W WO 2021058384 A1 WO2021058384 A1 WO 2021058384A1
Authority
WO
WIPO (PCT)
Prior art keywords
sources
audio
content
identifiers
denomination
Prior art date
Application number
PCT/EP2020/076072
Other languages
English (en)
Inventor
David Vincent
Frédéric BEAUCHAMP
Original Assignee
Tdf
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tdf filed Critical Tdf
Publication of WO2021058384A1 publication Critical patent/WO2021058384A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/38Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space
    • H04H60/41Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space for identifying broadcast space, i.e. broadcast channels, broadcast stations or broadcast areas
    • H04H60/43Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying broadcast time or space for identifying broadcast space, i.e. broadcast channels, broadcast stations or broadcast areas for identifying broadcast channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/30Aspects of broadcast communication characterised by the use of a return channel, e.g. for collecting users' opinions, for returning broadcast space/time information or for requesting data
    • H04H2201/37Aspects of broadcast communication characterised by the use of a return channel, e.g. for collecting users' opinions, for returning broadcast space/time information or for requesting data via a different channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/90Aspects of broadcast communication characterised by the use of signatures

Definitions

  • the field of the invention is that of the identification of audio content accessible by a receiver capable of receiving both content from a broadcast network and from a two-way network.
  • the invention relates more particularly to the fact of comparing the audio signals coming from the different sources and of establishing identifiers according to the identities and similarities between the audio signals
  • hybrid receivers In the field of broadcasting audio or audiovisual content, so-called “hybrid” receivers are known capable of receiving and reproducing both broadcasts originating from a broadcasting network and content transmitted from a site. Web, and content transmitted by podcast or "podcast” according to the English terminology. These receivers are provided with a user interface comprising a screen and a means for entering commands (keyboard, touch screen, voice recognition, etc.), radio reception means and means for transmitting sound signals to speakers. The user sets their device to receive content broadcast on the radio, or from a website. Certain hybrid devices can enhance the reception of audio content broadcast by an Internet or “IP” type connection, for example by improving the coverage area of the broadcast content by combining their traditional reception by broadcast network according to the following broadcast standards (list non-limiting):
  • DVB (acronym for Digital Video Broadcasting), DVB-T (the “T” meaning “Terrestrial”), DVB-S (the “S” meaning “Satellite”), with downloads or “streaming” according to the English terminology - Saxon by IP network (Wifi, 3G, 4G and 5G in the near future).
  • IP network Wi-Fi, 3G, 4G and 5G in the near future.
  • DAB Digital Audio Broadcasting
  • a user sets or programs their receiver to receive audio signals from any of these sources to receive the same content.
  • databases which identify a large number of sources and provide identifiers for receiving a particular program. These databases receive broadcast station or audio program names as input, and provide radio station identifiers with data to receive broadcasts.
  • the information relating to the radio stations they contain can be of a diverse nature: name of each station, genres, identifiers, logos, geographical location, transmitter parameters, daily or weekly programs, details of the current program, URLs streaming. This service is accessible through the Internet and access to these databases is generally chargeable.
  • the different source databases do not necessarily have a common identifier for the same radio, each of these databases can identify the same audio content in several different ways.
  • RTL which is the acronym of “Radio Telecommunication Luxembourg”
  • this name can be written either in capital letters: “RTL”, or in lowercase “rtl”, or separated by dots “RTL ". While these three scriptures refer to the radio station well in the public mind, IT considers them to be three different identifiers.
  • the identifier of the same audio source can also depend on the way it is received, this identifier can for example be suffixed by “PI” (meaning “Program Identifier” which is an identifier of the RDS system implemented in the FM radio) or by "FM". Likewise, the same radio station can have different URLs in several databases.
  • a content provider can pass information to identify a certain source at a certain point in time and this information is then made obsolete. Likewise, it is possible that the information transmitted is incorrect.
  • the problems of data consistency between databases evolve over time. Some errors are corrected and others appear following an update, for example. It is therefore difficult at a given moment to be sure to enter the correct identifier of a source to obtain the means to receive the associated audio stream.
  • the invention also proposes a server for collecting information on the availability of audio streams and for associating sources emitting the same audio content with at least one denomination of this content which is known to users.
  • a method for identifying audio content emitted by a plurality of identified audio sources said sources emitting an audio stream having a name presented to users.
  • the method is characterized in that it comprises the following steps executed at the level of a server (1):
  • the proposed solution is based on a completely new and inventive approach, making it possible to identify each stream by its audio content, to collect information from various databases and to bring them together to create associations to provide identifiers of source when a user wishes to receive certain content.
  • the comparison step consists in comparing signatures calculated on the segments transmitted by each of the sources. In this way, the comparison is facilitated.
  • the comparison step begins with a sub-step consisting in that the segments transmitted by the sources transmitting the audio streams having the same denomination are compared with each other, said sub-step triggering a sub-step association of this name with the identifiers of audio sources emitting the same content.
  • the method first compares audio contents with the same denomination and if they are identical, the source identifiers are then gathered in the same association, which minimizes the processing time.
  • the comparison step determines a level of similarity between the contents, and in that the association step also associates information representative of the similarity between the contents. In this way, contents with a great similarity can be easily put together, and offered for reproduction.
  • the comparison step detects redundancies of certain contents at determined periodic times, the association step then also associates a datum signifying the periodic nature of the similarities of the contents emitted by two different sources. In this way, users can be informed that certain sources provide identical content except at specific times, which is the case with national and local radio stations.
  • the identification method comprises the following subsequent steps executed at the level of a receiver: transmission to the server of a request comprising a name of an audio stream, reception from said server of a message containing at least one identifier of a source transmitting the identified audio stream, presentation of the at least one identifier on an interface for the purpose of selecting the source to receive said stream. In this way, the user is thus informed of the associations and can choose the source which suits him to receive a certain content.
  • the message transmitted to the receiver also contains the information representative of the similarity between the contents, and in that the step of presenting each identifier also presents, for each identifier, said information representative of the similarity between the contents. contents.
  • the user is informed of associations and can choose the source that suits him to receive desired content.
  • different identifiers of sources are associated with different names, these sources emitting the same audio content. In this way, if the same content is accessible under several names, it is easy to find the sources that broadcast them.
  • the identification method comprises a step of evaluating the validity of at least two names associated with the same content sent by two different sources, the association step associating the identifiers of these sources different with the denomination having the greatest validity value.
  • the invention also relates to an identification server for audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a denomination presented at the level of user receivers.
  • the server comprises a means of collecting the identifiers of sources and at least one denomination associated with the content transmitted by each of these sources, a means of receiving segments of the audio stream transmitted by each of these sources using their source identifiers, a means for comparing information representative of the audio content of each segment, in order to determine content identities and a memory for recording the associations of the identifiers of audio sources transmitting the same content with at least one denomination.
  • the invention also relates to a receiver for audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a designation presented at the level of user receivers, said receiver comprising means for receiving the audio content transmitted in the device. stream, means for reproducing said content, means for transmitting a request to a remote server containing a content designation in order to receive a list of identifiers of audio sources transmitting the content identified by this designation, display means of the list received and a means of selecting one of the displayed sources in order to start the reproduction of the content transmitted by this source.
  • Figure 1 shows the structure of a server for producing associations of content and audio sources, according to a particular embodiment of the invention
  • Figure 2 illustrates the main components of an audio content receiver device, according to an exemplary embodiment
  • Figure 3 shows a general diagram of the data processing in order to produce associations of audio content and sources
  • Figure 4 shows a flowchart of the search steps to collect information on audio sources, according to an exemplary embodiment
  • FIG. 5 represents a flowchart of the processing steps with a view to producing content and source associations according to an exemplary embodiment.
  • the invention relates to a method for identifying audio content transmitted by a plurality of identified audio sources, said sources transmitting an audio stream having a denomination presented to the users.
  • the method is characterized in that it comprises the following steps executed at the level of a server: a step of collection of source identifiers and at least one denomination associated with the content transmitted by each of these sources, a step of receiving segments of the audio stream transmitted by each of these sources using their source identifiers, a step of comparison of information representative of the audio content of each segment, in order to determine content identities, and a step of associating the identifiers of audio sources transmitting the same content with at least one denomination.
  • the proposed solution is based on a completely new and inventive approach, making it possible to identify each stream by its audio content and to perform comparisons of this content with other content to generate associations between sources emitting the same. content.
  • This server constitutes a service platform accessible by a network, the Internet for example, to obtain means for receiving a determined audio stream.
  • This audio stream is made up of a succession of data packets sent from a certain source, the payload of the packets containing sound signals to produce sound at a receiver and play it to users.
  • An audio source is identified by an identifier which depends on the type of source, if the signals come from an FM radio station then the identifier can be a carrier frequency, if the signals come from a computer site, the identifier is generally a URL.
  • the server 1 typically comprises a central unit 2 associated with a program memory 3, a module for receiving a radio stream 4 receiving broadcasts from a one-way broadcasting network, an FM network for example, and a communication module 5 for two-way communications using a cable.
  • the server 1 is directly accessible by an operator, it then has local input / output means 6 for a connection with a terminal and / or a printer.
  • the receiver also has a memory 7 capable of storing data coming from any one of the unidirectional or bidirectional reception means and of storing association data between audio sources and content names.
  • Fig. 2 illustrates the main components of a receiving apparatus 10, according to a particular embodiment of the invention.
  • the receiver 10 typically comprises a central unit 11 associated with a program memory 12, a module for receiving a radio stream 13 receiving transmissions from a unidirectional network, an FM network for example, and a communication module 14 allowing short or long range two-way communications by cable or radio, for example using the Bluetooth, WiFi and / or GSM network.
  • the receiver also has command input means 15 (keyboard, buttons, touch screen, etc.), and display means 16 (screen, indicator lights, voice synthesis, etc.). These means can be integrated into the device or deported.
  • the device also has means for reproducing audio content, for example composed of a remote screen, and / or an amplifier 17 integrated into the device emitting acoustic signals to remote loudspeakers 18.
  • the receiver 10 also has a memory 19 capable of storing audio and / or visual content broadcast by a unidirectional or bidirectional network.
  • the receiver 10 receives a power supply or has its own battery. It can be mobile and take the appearance of a smart mobile phone (or "smartphone" in English terminology. It can, for example, be in a traveling vehicle, the receiver is then a car radio.
  • the receiver allows you to receive an audio stream from a remote source.
  • the user enters a name for an audio content and the receiver sends a request to the server 1 to receive at least one identifier of a source transmitting the stream of this audio content.
  • Fig. 3 presents a general diagram of the data processing in order to produce associations of contents and audio sources.
  • a so-called “Data updater” server 30 is responsible for collecting data originating from a plurality of different sources 31, 32. The collected data associates a certain identifier of audio content with a source. The data collected is gathered in a memory 33 called “raw data”.
  • an analysis module 34 is executed in order to read this data, convert it into audio signals and process it. transmitting these audio signals to a comparison module 35 in order to determine their similarities, differences and identities.
  • the analysis 34 and comparison 35 modules produce validated data consisting of a list of content denomination associations with identifiers of audio sources of different types allowing receivers 10 to receive this audio content.
  • the data relating to identifiers of audio sources will be gathered in a so-called "raw" database, in the sense that they are stored without prior processing.
  • the server 1 collects data continuously and cyclically, the duration of each cycle depending on the number of radio stations to be scanned, and the databases to be interrogated.
  • the server 1 sends requests to public or private databases, with the aim of receiving from these databases associations of identifiers and reception means.
  • the server receives the association data and stores them in memory 7.
  • the server 1 scans the FM frequencies with a view to discovering the radio stations which are currently broadcasting audio content.
  • the identity of the transmitting station can be determined using the R.D.S. which consists of incorporating the station identifier into the radio signals. Another way of doing this is to analyze the audio signals in order to detect jingles which are very often characteristic of the station, these jingles can be only musical, or contain the name of the station.
  • the server After each frequency scan, the server records in the memory 7 associations between a name of the transmitting station and a given frequency.
  • the server interrogates sites already referenced and which are supposed to transmit audio signals continuously. A short audio segment can be saved to memory for identification verification. These three steps can take place at the same time since they can use different hardware resources.
  • the memory 7 contains raw data which is then used to generate verified lists associating at least one name of an audio content with identifiers of audio sources (step 4.4).
  • the processing of raw data is shown schematically by the flowchart in Fig. 5. All of the audio source identifiers stored in memory 7 are compared with each other in order to detect identities.
  • the server searches for associations with the same audio stream names and the same audio source identifiers. In this case, there is no need to maintain duplicate associations, and the two associations are reduced to one.
  • the server calculates the signatures of the audio signals emitted by all the sources identified in the raw database (step 5.2), this calculation is carried out globally for all the signals during a certain period of time, or as a background process. The calculation can also be done on an ad hoc basis when the processing needs to calculate the signature of a content.
  • the signature calculation is performed by receiving the audio content transmitted by an identified source (by connecting to an IP address, or by setting the radio reception means 4 with the identified frequency) and using the data received in the stream.
  • the server searches for associations comprising the same names of audio streams and different source identifiers. The server then checks by comparing them whether the audio content transmitted by the sources thus identified are identical (step 5.4). For this, the server uses an audio signal comparison module which is a technique known per se.
  • Patent No. EP 1 741 047 filed by the applicant on March 18, 2005 describes a method using a signature of audio signals in order to determine the similarities, the differences and the similarities of two audio streams. If at the end of this comparison, the audio contents are the same, then it can be deduced that it forms only one and that the latter is accessible from at least two sources.
  • the server creates an association between this identifier and the two discovered sources, and records this association in a dedicated part of the memory 7 (step 5.5). Whenever, in the raw data, the server determines that the same audio content designated by the same identifier, is transmitted by different sources, it then associates all the sources with this identifier.
  • the server searches the stream for information on the name of the audio content transmitted.
  • This information can be specific data of the RDS type transmitted in a unidirectional stream, or recurring data transmitted every hour and characteristic of a certain audio content. For example, some radio stations broadcast a jingle at each time of day that is recognizable and specific to the station.
  • the server can have a library of jingles making it possible to better identify audio content.
  • the server compares the audio signals of a content with the audio signals of the other content accessible by the raw data recorded in the memory (step 5.6).
  • the server If another content is found, then it is possible to correct the naming of the first content by using the second.
  • the correction of a denomination is usually based on a confidence index, this index is maximum when the denomination is extracted from a stream (by RDS signals for example). If the name is not readable in the signals, the index can be proportional to the number of associations between the same content and the same source identifier. If, for example, the same audio content is accessible from five different sources and it is named four times according to a first name and another time with another, the first name is clearly the most plausible. In this case, and according to a first variant, the server considers that the least plausible name is erroneous, it must be deleted and replaced by the most plausible name.
  • the server aggregates all the names in a list, which is associated with the list of all the source identifiers. If a receiver sends a reception request to the server 1 by transmitting a denomination of a content, it will receive the list of all the source identifiers associated with this denomination. According to an improvement, the confidence index associated with each denomination is also transmitted, in this way the user can realize the safest denomination to designate this content. Step 5.6 also compares the data of the flows whose identifiers have only been recorded once, these flows are said to be “unitary”.
  • step 5.6 the name of a content was found only once in the searches carried out during steps 4.1, 4.2 and 4.3, and that this content is identical to that sent by another source under another name, then the two names as well as the two identifiers of these two sources are agglomerated and referenced in the same association (step 5.5).
  • the server 1 Take for example the RTL radio station which transmits radio waves on the carrier frequency of 104.3 Mhz and suppose that the content of this radio is also accessible under the name "RTL" at the address URL_1, then the server 1 produces the 'association below and stores it in the dedicated part of memory 7:
  • a receiver requests a source providing the content of this radio station, the request can either contain "RTL” or “R.T.L. ", And the response will contain at least all of the source identifiers: 104.3 MHz or URL_1. In this way, a user of such a receiver will be able to choose which is the source he wishes to use to receive this content. If he knows that his receiver has a low speed through his wired communication network, he can choose the radio stream. On the other hand, if he knows that the radio conditions are not good, he may prefer the wired network.
  • the associations of identifiers and names of sources are brought together in the same so-called dedicated database, which is recorded in the memory 7 of the server 1 (step 5.8).
  • a user can use his receiver 10 to access the server 1 and ask it by a request containing at least one content denomination at least one identifier of a source to receive this content.
  • the server 1 then reads in its memory 7 and searches for the associations containing the denomination indicated, it then returns the associated identifiers.
  • Receiver 1 presents the data transmitted in a menu displayed on screen 16. This menu displays the list of unit identifiers. source, but also other names designating the same audio content. The user then selects one of the source identifiers displayed, which triggers the connection to this source and the reception at the level of the receiver of the requested content.
  • the server starts again for further processing, using new segments. In this way, the list of associations is constantly updated.
  • the signature comparison modules two by two which are implemented during steps 5.4 and 5.6, provide three results: the signatures are perfectly identical, the signatures are partially identical, the signatures are completely different.
  • the signatures are partially identical when, for example, the two contents are provided by a national broadcasting station and by a local station. In such a case, most of the time the content is the same but at certain times the national content is replaced by local content, for example a regional newspaper, or a report on a local activity.
  • the station transmits advertising sequences during dedicated time slots, the content of these slots is modified so as to be replaced by more locally suitable content.
  • the signature comparison module detects a large similarity between the data and can determine that over a large period of time the sound signals are the same. According to the present invention, if the signatures are perfectly identical, then the contents are identical and the associated sources emit the same audio content. These sources are associated with the same denomination (s) of content.
  • a verification module detects the redundancies between the identities and the differences in content. If the differences occur randomly, they may be events due to poor reception and / or the presence of interference, or even the result of chance.
  • the verification module considers that these are two different contents. If, on the other hand, there are many redundancies and the differences appear very regularly and for a constant period from time to time, then we can consider that one of the contents is a variation of the other.
  • the two sources, and possibly the two names are recorded in the dedicated memory according to the same association. An indication is added to indicate that the contents are identical except at certain times. In this way, a user can be warned that he can receive several local versions of the same national radio station, and can optionally select content that does not correspond to his region.
  • the verification module analyzes the content over a fairly long period of time, on the order of 12 hours or 24 hours, preferably starting at a particular time, at OOhOO for example.
  • the method uses a module for evaluating the similarities between names, this module determines in step 5.4 that the names are similar and treats them as if they are identical. This is the case, for example, when the names are written one in upper case and the other in lower case, or when a spelling error has crept in in one of the names.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

L'invention concerne un procédé d'identification de contenu audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée à des utilisateurs. Le procédé est caractérisé en ce qu'il comporte les étapes suivantes exécutées au niveau d'un serveur (1) : une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d'au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison (5.4) d'informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, une étape d'association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination. De cette manière, il est possible d'identifier chaque flux par son contenu audio et d'effectuer des comparaisons de ce contenu avec d'autres pour générer des associations entre des sources émettant le même contenu.

Description

DESCRIPTION
Titre : Procédé d’identification de flux audio provenant d’une pluralité de sources, système, récepteur et programme associé au procédé
1. DOMAINE DE L’INVENTION
Le domaine de l’invention est celui de l’identification des contenus audio accessibles par un récepteur capable de recevoir à la fois des contenus d’un réseau de diffusion et d’un réseau bidirectionnel. L’invention concerne plus particulièrement le fait de comparer les signaux audio en provenance des différentes sources et d’établir des identificateurs en fonction des identités et des ressemblances entre les signaux audio
2. ARRIÈRE-PLAN TECHNOLOGIQUE
Dans le domaine de la diffusion de contenus audio ou audiovisuels, il est connu des récepteurs dits « hybrides » capables de recevoir et de reproduire à la fois des émissions en provenance d’un réseau de diffusion, des contenus transmis à partir d’un site Web, et des contenus transmis en baladodiffusion ou « podcast » selon la terminologie anglo-saxonne. Ces récepteurs sont dotés d’une interface utilisateur comportant un écran et d’un moyen d’introduction de commandes (clavier, écran tactile, reconnaissance vocale, ..), des moyens de réception radio et des moyens d’émission de signaux sonores vers des haut- parleurs. L’utilisateur règle son appareil pour recevoir un contenu diffusé à la radio, ou en provenance d’un site Internet. Certains appareils hybrides peuvent enrichir la réception de contenus audio diffusés par une connexion de type Internet ou « IP », par exemple en améliorant la zone de couverture des contenus diffusés en combinant leurs réceptions traditionnelles par réseau de diffusion selon les normes de diffusion suivantes (liste non limitatives) :
- FM (Fréquence Modulée) ou AM (modulation d’amplitude),
- DAB (acronyme de Digital Audio Broadcasting »), DAB+,
- DMB,
- DRM, DRM+,
- DVB (acronyme de Digital Vidéo Broadcasting »), DVB-T (le « T » signifiant « Terrestre »), DVB-S (le « S » signifiant « Satellite»), avec des téléchargements ou « streaming » selon la terminologie anglo- saxonne par réseau IP (Wifi, 3G, 4G et 5G dans un futur proche). Ces différentes sources peuvent fournir le même contenu audio. En effet, il est fréquent qu’une station radio nationale émette des signaux radio en FM à partir d’un réseau terrestre hertzien, des signaux numériques selon le standard DAB (acronyme de « Digital Audio Broadcasting »), et dispose d’un site Web accessible par une adresse IP pour transmettre le contenu audio émis en temps réel. Un utilisateur règle ou programme son récepteur pour recevoir les signaux audio selon l’une quelconque de ces sources pour recevoir le même contenu.
Il est également connu des bases de données qui recensent un grand nombre de sources et fournissent des identifiants pour recevoir tel ou tel programme. Ces bases de données reçoivent en entrée des noms de station d’émission ou de programmes audio, et fournissent des identifiants de stations radio avec les données permettant de recevoir les émissions. Les informations relatives aux stations de radio qu’elles contiennent peuvent être de nature diverse : nom de chaque station, genres, identifiants, logos, localisation géographique, paramètres des émetteurs, programmes du jour ou hebdomadaire, détails de l’émission en cours, URLs de streaming. Ce service est accessible par Internet et l’accès de ces bases est généralement payant.
Ces bases sont mises à jour par les gestionnaires des stations radio et de façon plus générale par les fournisseurs de contenus audio qui ont intérêt à se faire connaître du public pour ainsi augmenter leur audience. Ces bases reçoivent donc des informations en provenance d’émetteurs certifiés mais ne vérifient pas si les contenus émis par les sources identifiées par les informations reçues correspondent bien aux signaux audio diffusés par ces fournisseurs de contenu. Cette absence de vérification peut entraîner des erreurs dans l’identification des contenus.
Tout d’abord, les différentes bases de données sources ne possèdent pas forcément un identifiant commun pour une même radio, chacune de ces bases de données peut identifier un même contenu audio de plusieurs façons différentes. Prenons par exemple, le nom d’une station radio tel que R.T.L., qui est l’acronyme de « Radio Télé Luxembourg », ce nom peut s’écrire soit en majuscule : « RTL », soit en minuscule « rtl », soit séparé par des points « R.T.L. ». Bien que ces trois écritures désignent bien la station de radio dans l’esprit du public, l’informatique considère que ce sont trois identifiants différents.
L’identifiant d’une même source audio peut également dépendre de la façon de la recevoir, cet identifiant peut par exemple être suffixé par « PI » (signifiant « Program Identifier » qui est un identifiant du système RDS mis en œuvre dans les radio FM) ou par « FM ». De la même façon, une même station de radio peut avoir des URLs différentes dans plusieurs bases.
De plus, il arrive que, soit du fait d’erreurs lors de la collecte de ces URLs, soit du fait d’évolution de celles-ci, une URL associée à une station de radio ne soit plus connectée à un flux correspondant à la station de radio à laquelle elle est associée. Du fait d’erreurs informatiques ou humaines, une URL peut pointer vers le flux d’une autre station de radio.
Enfin, un fournisseur de contenu peut transmettre des informations pour identifier une certaine source à un certain moment et celles-ci sont ensuite rendues obsolètes. De même, il est possible que les informations transmises soient erronées. De façon générale, les problèmes de cohérence des données entre les bases évoluent dans le temps. Certaines erreurs sont corrigées et d’autres apparaissent à la suite d’une mise à jour par exemple. Il est donc difficile à un instant donné d’être sûr d’introduire le bon identifiant d’une source pour obtenir les moyens de recevoir le flux audio associé.
3. OBJECTIFS DE L’INVENTION
Il existe donc un réel besoin d’un procédé permettant d’associer au moins un identifiant d’une source audio qui est connu des utilisateurs, avec au moins un moyen pour recevoir le flux audio ainsi identifié.
L’invention propose également un serveur pour récolter des informations sur la disponibilité des flux audio et pour associer des sources émettant le même contenu audio avec au moins une dénomination de ce contenu qui est connue des utilisateurs.
4. PRESENTATION DE L’INVENTION
Dans un mode de réalisation particulier de l’invention, il est proposé un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) :
- une étape de collecte (4.1, 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,
- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, - une étape de comparaison (5.4) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,
- une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination.
Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio, de collecter des informations provenant de diverses bases de données et de les rassembler pour créer des associations pour fournir des identifiants de source lorsqu’un utilisateur désire recevoir un certain contenu.
Selon un premier mode de réalisation, l’étape de comparaison consiste à comparer des signatures calculées sur les segments émis par chacune des sources. De cette manière, la comparaison est facilitée.
Selon un autre mode de réalisation, l’étape de comparaison commence par une sous-étape consistant en ce que les segments émis par les sources émettant les flux audio ayant la même dénomination sont comparés entre eux, ladite sous-étape déclenchant une sous-étape d’association de cette dénomination avec les identifiants de sources audio émettant le même contenu. De cette manière, le procédé compare d’abord les contenus audio ayant la même dénomination et s’ils sont identiques, les identifiants de sources sont alors rassemblés dans une même association, ce qui minimise le temps de traitement.
Selon un autre mode de réalisation, l’étape de comparaison détermine un niveau de similitude entre les contenus, et en ce que l’étape d’association associe également une information représentative de la similitude entre les contenus. De cette manière, les contenus présentant une grande similitude peuvent être facilement rassemblés, et proposés à des fins de reproduction.
Selon un autre mode de réalisation, l’étape de comparaison détecte des redondances de certains contenus à des moments périodiques déterminés, l’étape d’association associe alors également une donnée signifiant le caractère périodique des similitudes des contenus émis par deux sources différentes. De cette manière, les utilisateurs peuvent être informés que certaines sources fournissent des contenus identiques sauf à des moments déterminés, ce qui est le cas de station radio nationales et locales. Selon un autre mode de réalisation, le procédé d’identification comporte les étapes ultérieures suivantes exécutées au niveau d’un récepteur : émission vers le serveur d’une requête comportant une dénomination d’un flux audio, réception en provenance dudit serveur d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié, présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux. De cette manière, G utilisateur est ainsi informé des associations et peut choisir la source qui lui convient pour recevoir un certain contenu.
Selon un autre mode de réalisation, le message transmis au récepteur contient également l’information représentative de la similitude entre les contenus, et en ce que l’étape de présentation de chaque identifiant présente également pour chaque identifiant ladite information représentative de la similitude entre les contenus. De cette manière, l’utilisateur est informé des associations et peut choisir la source qui lui convient pour recevoir un contenu souhaité.
Selon un autre mode de réalisation, des identifiants différents de sources sont associés à des dénominations différentes, ces sources émettant le même contenu audio. De cette manière, si un même contenu est accessible sous plusieurs dénominations, il est facile de retrouver les sources qui les émettent.
Selon un autre mode de réalisation, le procédé d’identification comporte une étape d’évaluation de la validité d’au moins deux dénominations associées à un même contenu émis par deux sources différentes, l’étape d’association associant les identifiants de ces sources différentes avec la dénomination ayant la valeur de validité la plus grande.
L’invention concerne également un serveur d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs. Le serveur comporte un moyen de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, un moyen de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, un moyen de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus et une mémoire pour enregistrer les associations des identifiants de sources audio émettant le même contenu avec au moins une dénomination. L’invention concerne également un récepteur de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs, ledit récepteur comporte des moyens de réception des contenus audio transmis dans le flux, des moyens de reproduction desdits contenus, un moyen d’émission d’une requête vers un serveur distant contenant une dénomination de contenu afin de recevoir une liste des identifiants de sources audio émettant le contenu identifié par cette dénomination, un moyen d’affichage de la liste reçue et un moyen de sélection d’une des sources affichées afin de lancer la reproduction du contenu émis par cette source.
5. DESCRIPTION DES FIGURES
D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description suivante, donnée à titre d’exemple indicatif et non limitatif, et des dessins annexés, dans lesquels :
-[Fig 1] : la figure 1 présente la structure d’un serveur pour produire des associations de contenus et de sources audio, selon un mode de réalisation particulier de l'invention ;
-[Fig 2] : la figure 2 illustre les principaux composants d’un appareil récepteur d’un contenu audio, selon un exemple de réalisation ;
-[Fig 3] : la figure 3 présente un schéma général du traitement des données afin de produire des associations de contenus et de sources audio ;
-[Fig 4] : la figure 4 présente un ordinogramme des étapes de recherche pour collecter des informations sur les sources audio, selon un exemple de réalisation ;
-[Fig 5] : la figure 5 représente un ordinogramme des étapes de traitement en vue de produire des associations de contenu et de source selon un exemple de réalisation.
6. DESCRIPTION DETAILLEE D’UN MODE DE REALISATION
L’invention concerne un procédé d’identification de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée aux utilisateurs. Le procédé est caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur : une étape de collecte des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, une étape de réception de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, une étape de comparaison d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus, et une étape d’association des identifiants de sources audio émettant le même contenu avec au moins une dénomination. Ainsi, la solution proposée repose sur une approche tout à fait nouvelle et inventive, permettant d’identifier chaque flux par son contenu audio et d’effectuer des comparaisons de ce contenu avec d’autres contenus pour générer des associations entre des sources émettant le même contenu.
(72 _ _Description_d ’_un mode particulier de_réali_sation
Sur toutes les figures du présent document, les éléments (ou les étapes) identiques sont désignées par une même référence numérique.
On présente maintenant, en relation avec la fig. 1, une structure d’un serveur 1, selon un mode de réalisation particulier de l'invention. Ce serveur constitue une plateforme de service accessible par un réseau, Internet par exemple, pour obtenir des moyens de réception d’un flux audio déterminé. Ce flux audio est constitué d’une succession de paquets de données émis par une certaine source, la charge utile des paquets contenant des signaux sonores pour produire un son au niveau d’un récepteur et le faire entendre à des utilisateurs. Une source audio est identifiée par un identifiant qui dépend du type de source, si les signaux proviennent d’une station radio FM alors l’identifiant peut être une fréquence porteuse, si les signaux proviennent d’un site informatique, l’identifiant est généralement une URL.
Le serveur 1 comporte typiquement une unité centrale 2 associée à une mémoire de programme 3, un module de réception d’un flux radio 4 recevant des émissions d’un réseau de diffusion monodirectionnel, un réseau FM par exemple, et un module de communication 5 pour des communications bidirectionnelles à Laide d’un câble. Dans un cas très particulier, où le serveur 1 est directement accessible par un opérateur, il dispose alors de moyens d’entrée/sortie local 6 pour une connexion avec un terminal et/ou une imprimante. Le récepteur dispose également d’une mémoire 7 capable de stocker des données en provenance de l’un quelconque des moyens de réception unidirectionnel ou bidirectionnel et pour mémoriser des données d’associations entre des sources audio et des dénominations de contenus. La Fig. 2 illustre les principaux composants d’un appareil récepteur 10, selon un mode de réalisation particulier de l'invention. Le récepteur 10 comporte typiquement une unité centrale 11 associée à une mémoire de programme 12, un module de réception d’un flux radio 13 recevant des émissions d’un réseau monodirectionnel, un réseau FM par exemple, et un module de communication 14 autorisant des communications bidirectionnelles à courte ou à longue portée par un câble ou par la radio, en utilisant par exemple le réseau Bluetooth, Wifi et/ou GSM. Le récepteur dispose également de moyens d’introduction de commande 15 (clavier, boutons, écran tactile, ...), et de moyens d’affichage 16 (écran, voyants lumineux, synthèse vocale, ...). Ces moyens peuvent être intégrés à l’appareil ou déportés. L’appareil dispose également d’un moyen de reproduction d’un contenu audio, composé par exemple d’un écran déporté, et/ou d’un amplificateur 17 intégré à l’appareil émettant des signaux acoustiques vers des haut-parleurs déportés 18. Selon un perfectionnement non obligatoire, le récepteur 10 dispose également d’une mémoire 19 capable de stocker un contenu audio et/ou visuel diffusé par un réseau unidirectionnel ou bidirectionnel.
Le récepteur 10 reçoit une alimentation électrique ou dispose de sa propre batterie. Il peut être mobile et prendre l’aspect d’un téléphone portable intelligent (ou « smartphone » selon la terminologie anglo-saxonne. Il peut par exemple être embarqué dans un véhicule itinérant, le récepteur est alors un autoradio.
Le récepteur permet de recevoir un flux audio d’une source distante. L’utilisateur introduit une dénomination d’un contenu audio et le récepteur émet une requête vers le serveur 1 pour recevoir au moins un identifiant d’une source émettant le flux de ce contenu audio.
Après avoir détaillé les principaux dispositifs permettant de mettre en œuvre le procédé, nous allons maintenant expliquer comment ceux-ci coopèrent.
La Fig. 3 présente un schéma général du traitement des données afin de produire des associations de contenus et de sources audio. Un serveur 30 dit « Data updater » est chargé de collecter des données provenant d’une pluralité de sources différentes 31, 32. Les données collectées associent un certain identifiant de contenu audio avec une source. Les données collectées sont rassemblées dans une mémoire 33 dites de « données brutes ». A un certain moment, un module d’analyse 34 est exécuté afin de lire ces données, de les convertir en signaux audio et de les transmettre à un module de comparaison 35 de ces signaux audio afin d’en déterminer les similitudes, les différences et les identités.
Les modules d’analyse 34 et de comparaison 35 produisent des données validées consistant en une liste d’associations de dénominations de contenus avec des identifiants de sources audio de différents types permettant à des récepteurs 10 de recevoir ces contenus audio.
Nous allons maintenant détailler plus spécifiquement les différentes opérations permettant de produire les données validées.
6.3 Phase de recherche d’informations
Selon une première phase de recherche d’informations, qui est illustrée par la Fig. 4, les données relatives à des identifiants de sources audio vont être rassemblées dans une base de données dites « brutes », en ce sens qu’elles sont mémorisées sans traitement préalable. Le serveur 1 collecte des données en permanence et de façon cyclique, la durée de chaque cycle dépendant du nombre de stations radio à scanner, et des bases de données à interroger.
Selon une étape 4.1, le serveur 1 émet des requêtes à destination des bases de données publiques ou privées, dans le but de recevoir de ces bases des associations d’ identifiants et de moyens de réception. Le serveur réceptionne les données d’associations et les enregistre dans la mémoire 7.
Selon une autre étape 4.2, le serveur 1 scanne les fréquences FM en vue de découvrir les stations radio qui diffusent actuellement des contenus audio. L’identité de la station émettrice peut être déterminée en utilisant le système R.D.S. qui consiste à incorporer dans les signaux radio l’identifiant de la station. Une autre façon de faire consiste à analyser les signaux audio de façon à détecter des jingles qui sont très souvent caractéristiques de la station, ces jingles peuvent être uniquement musicaux, ou contenir le nom de la station. Après chaque scan des fréquences, le serveur enregistre dans la mémoire 7 des associations entre un nom de station émettrice et une fréquence donnée.
Selon une autre étape 4.3, le serveur interroge des sites déjà référencés et qui sont censés émettre des signaux audio en continu. Un segment audio d’une courte durée peut être enregistré dans la mémoire à des fins de vérification de l’identification. Ces trois étapes peuvent se dérouler en même temps puisqu’elles peuvent utiliser des ressources matérielles différentes. A la fin de chaque cycle de collecte, la mémoire 7 contient des données brutes qui sont ensuite exploitées pour générer des listes vérifiées associant au moins une dénomination d’un contenu audio avec des identifiants de sources audio (étape 4.4).
6.4 Phase de traitement des informations récoltées
Le traitement des données brutes est schématisé par l’ordinogramme de la Fig. 5. L’ensemble des identifiants de sources audio enregistrés dans la mémoire 7 sont comparés les uns aux autres afin de détecter des identités. A l’étape 5.1, le serveur recherche les associations ayant les mêmes dénominations de flux audio et les mêmes identifiants de sources audio. Dans ce cas, il est inutile de maintenir des associations en double, et les deux associations sont réduites à une seule. Le serveur calcule ensuite les signatures des signaux audio émis par toutes les sources identifiées dans la base de données brutes (étape 5.2), ce calcul s’effectue globalement pour tous les signaux au cours d’une certain laps de temps, ou en tant que tache de fond. Le calcul peut aussi s’effectuer ponctuellement lorsque le traitement a besoin de calculer la signature d’un contenu. Le calcul de signature s’effectue en recevant le contenu audio émis par une source identifiée (en se connectant à une adresse IP, ou en réglant le moyen de réception radio 4 avec la fréquence identifiée) et en utilisant les données reçues dans le flux.
A l’étape 5.3, le serveur recherche des associations comportant les mêmes dénominations de flux audio et des identifiants de source différents. Le serveur vérifie alors en les comparant si les contenus audio émis par les sources ainsi identifiées sont identiques (étape 5.4). Pour cela, le serveur utilise un module de comparaison de signaux audio qui est une technique connue en soi. Le brevet n° EP 1 741 047 déposé par la demanderesse le 18 Mars 2005 décrit un procédé utilisant une signature de signaux audio afin de déterminer les ressemblances, les différences et les similitudes de deux flux audio. Si à l’issue de cette comparaison, les contenus audio sont les mêmes, alors on peut déduire qu’il ne forme qu’un et que ce dernier est accessible selon au moins deux sources. Dans ce cas, le serveur crée une association entre cet identifiant et les deux sources découvertes, et enregistre cette association dans une partie dédiée de la mémoire 7 (étape 5.5). Chaque fois que, dans les données brutes, le serveur détermine que le même contenu audio désigné par le même identifiant, est transmis par des sources différentes, il associe alors l’ensemble des sources à cet identifiant.
Si par contre les contenus audio ne sont pas les mêmes, alors une des deux dénominations peut être erronée. Dans ce cas et selon une première stratégie, le serveur recherche dans le flux des informations sur la dénomination du contenu audio émis. Ces informations peuvent être des données spécifiques de type RDS émises dans un flux unidirectionnel, ou des données récurrentes émises toutes les heures et caractéristiques d’un certain contenu audio. Par exemple, certaines stations radio émettent à chaque changement d’heure un jingle qui est reconnaissable et spécifique à la station. Le serveur peut disposer d’une bibliothèque de jingles permettant de mieux identifier des contenus audio. Selon une seconde stratégie, le serveur compare les signaux audio d’un contenu avec les signaux audio des autres contenus accessibles par les données brutes enregistrées dans la mémoire (étape 5.6). Si un autre contenu est trouvé, alors il est possible de rectifier la dénomination du premier contenu en utilisant le second. La correction d’une dénomination est habituellement basée sur un indice de confiance, cet indice est maximal lorsque la dénomination est extraite d’un flux (par des signaux RDS par exemple). Si la dénomination n’est pas lisible dans les signaux, l’indice peut être proportionnel au nombre d’associations entre un même contenu et un même identifiant de source. Si par exemple, un même contenu audio est accessible selon cinq sources différentes et qu’il est dénommé quatre fois selon une première dénomination et une autre fois avec une autre, la première dénomination est clairement la plus plausible. Dans ce cas, et selon une première variante, le serveur considère que la dénomination la moins plausible est erronée, elle doit être supprimée et remplacée par la dénomination la plus plausible. Selon une seconde variante, le serveur agglomère toutes les dénominations dans une liste, qui est associée à la liste de tous les identifiants de source. Si un récepteur émet vers le serveur 1 une requête de réception en transmettant une dénomination d’un contenu, il recevra la liste de tous les identifiants de source associés à cette dénomination. Selon un perfectionnement, l’indice de confiance associé à chaque dénomination est également transmis, de cette façon l’utilisateur peut se rendre compte de la dénomination la plus sûre pour désigner ce contenu. L’étape 5.6 compare également les données des flux dont les identifiants n’ont été recensés qu’une seule fois, ces flux sont dits « unitaires ». Si à l’étape 5.6, la dénomination d’un contenu n’a été trouvée qu’une seule fois dans les recherches effectuées au cours des étapes 4.1, 4.2 et 4.3, et que ce contenu est identique à celui émis par une autre source sous une autre dénomination, alors les deux dénominations ainsi que les deux identifiants de ces deux sources sont agglomérés et référencés dans une même association (étape 5.5). Prenons par exemple la station radio RTL qui émet des ondes radio sur la fréquence porteuse de 104,3 Mhz et supposons que le contenu de cette radio est également accessible sous la dénomination « R.T.L. » à l’adresse URL_1, alors le serveur 1 produit l’association ci-dessous et la mémorise dans la partie dédiée de la mémoire 7 :
[RTL ou R.T.L. / 104,3 MHz ou URL_1]
Si plus tard, un récepteur demande une source fournissant le contenu de cette station radio, la requête pourra indifféremment contenir « RTL » ou « R.T.L. », et la réponse contiendra au moins l’ensemble des identifiants de sources : 104,3 MHz ou URL_1. De cette manière, un utilisateur d’un tel récepteur pourra choisir qu’elle est la source qu’il désire utiliser pour recevoir ce contenu. S’il sait que son récepteur dispose d’un faible débit par son réseau de communication filaire, il peut choisir le flux radio. Par contre, s’il sait que les conditions radio ne sont pas bonnes, il pourra privilégier le réseau filaire.
Si par contre, le contenu analysé n’est identique à aucun autre, aucune autre association ne sera produite et les données de ce contenu enregistrées dans la mémoire dédiée resteront les mêmes que les données brutes. Il ne sera possible d’accéder à ce contenu que par un seul moyen (étape 5.7).
A l’issue des étapes 5.5, 5.6 et 5.7, les associations d’identifiants et de dénominations de sources sont rassemblées dans une même base de données dites dédiée, qui est enregistrée dans la mémoire 7 du serveur 1 (étape 5.8). A l’étape 5.9, un utilisateur peut utiliser son récepteur 10 pour accéder au serveur 1 et lui demander par une requête contenant au moins une dénomination de contenu au moins un identifiant d’une source pour recevoir ce contenu. Le serveur 1 lit alors dans sa mémoire 7 et recherche les associations contenant la dénomination indiquée, il renvoie alors les identifiants associés. Le récepteur 1 présente les données transmises dans un menu affiché à l’écran 16. Ce menu fait apparaître la liste des identifiants de source, mais aussi les autres dénominations désignant le même contenu audio. L’utilisateur sélectionne alors un des identifiants de source affichés, ce qui déclenche la connexion à cette source et la réception au niveau du récepteur du contenu demandé.
Une fois que toutes les signatures ont été comparées au moins une fois avec une autre signature, et que toutes les associations ont été mémorisées dans la mémoire dédiée, le serveur repart pour un nouveau traitement, en utilisant de nouveaux segments. De cette manière, la liste des associations est constamment mise à jour.
Il s’avère que de nombreux contenus sont émis par au moins deux sources, il est donc avantageux de profiter de ces identités pour regrouper ces sources de façon à réduire le nombre des comparaisons. Le déroulement d’étapes décrit ci-dessus permet de réduire le nombre de contenus à comparer et donc le nombre de signature, en regroupant les sources qui émettent le même contenu. Le déroulement d’étapes permet également de vérifier l’exactitude des identifiants de source et des dénominations.
6.5 Détermination de similitudes entre les signatures
Dans certains cas, les modules de comparaison de signatures deux à deux, qui sont mis en œuvre lors des étapes 5.4 et 5.6, fournissent trois résultats : les signatures sont parfaitement identiques, les signatures sont partiellement identiques, les signatures sont complètement différentes.
Les signatures sont partiellement identiques lorsque par exemple, les deux contenus sont fournis par une station de diffusion nationale et par une station locale. Dans un tel cas, la plupart du temps, les contenus sont identiques mais à certaines heures, le contenu national est remplacé par un contenu local, par exemple un journal régional, ou un reportage sur une activité locale. Selon un autre exemple, la station émet des séquences publicitaires au cours de plages temporelles dédiées, le contenu de ces plages est modifié pour être remplacé par un contenu plus adapté localement. Le module de comparaison de signatures détecte une grande similitude entre les données et peut déterminer qu’au cours d’un grand laps de temps, les signaux sonores sont identiques. Selon la présente invention, si les signatures sont parfaitement identiques, alors les contenus sont identiques et les sources associées émettent le même contenu audio. Ces sources sont associées avec le ou les mêmes dénomination(s) de contenu.
Si les signatures sont partiellement identiques, un module de vérification détecte les redondances entre les identités et les différences de contenus. Si les différences interviennent aléatoirement, il peut s’agir d’événements dus à une mauvaise réception et/ou à la présence de parasites, ou encore le fruit du hasard.
C’est le cas par exemple de deux stations radio différentes qui diffusent la même chanson quasiment au même moment. Dans ce cas, le module de vérification considère que ce sont deux contenus différents. Si par contre les redondances sont nombreuses et les différences apparaissent très régulièrement et pendant une période constante d’une fois sur l’autre, alors on peut considérer qu’un des contenus est une déclinaison de l’autre. Dans ce cas, les deux sources, et éventuellement les deux dénominations (si elles sont différentes, par exemple des noms de stations comportant le nom de la région de diffusion) sont enregistrées dans la mémoire dédiée selon la même association. Une indication est rajoutée pour indiquer que les contenus sont identiques sauf à certains moments. De cette façon, un utilisateur peut être averti qu’il peut recevoir plusieurs déclinaisons locales d’une même station radio nationale, et peut éventuellement sélectionner des contenus qui ne correspondent pas à sa région.
Le module de vérification analyse les contenus au cours d’une période de temps assez longue, de l’ordre de 12h ou de 24 heures, en commençant de préférence à un moment particulier, à OOhOO par exemple.
Selon un perfectionnement, le procédé utilise un module d’évaluation des similitudes entre des dénominations, ce module détermine à l’étape 5.4 que les dénominations sont similaires et les traite comme si elles sont identiques. C’est le cas par exemple lorsque les dénominations sont écrites l’une en majuscule, et l’autre en minuscule, ou encore lorsqu’une faute d’orthographe s’est glissée dans l’une des dénominations.
Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation doivent être considérés à titre d'illustration mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.

Claims

REVENDICATIONS
1. Procédé d’identification de contenu audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée à des utilisateurs ; caractérisé en ce qu’il comporte les étapes suivantes exécutées au niveau d’un serveur (1) :
- une étape de collecte (4.1 , 4.2, 4.3) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources,
- une étape de réception (5.2) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source,
- une étape de comparaison (5.4, 5.6) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus,
- une étape d’association (5.8) des identifiants de sources audio émettant le même contenu avec au moins une dénomination.
2. Procédé d’identification de contenu audio selon la revendication 1 ; caractérisé en ce que l’étape de comparaison (5.4, 5.6) consiste à comparer des signatures calculées sur les segments émis par chacune des sources.
3. Procédé d’identification de contenu audio selon la revendication 1 ou 2 ; caractérisé en ce que l’étape de comparaison commence par une sous-étape consistant en ce que les segments émis par les sources émettant les flux audio ayant la même dénomination sont comparés entre eux, ladite sous-étape déclenchant une sous-étape d’association (5.5) de cette dénomination avec les identifiants de sources audio émettant le même contenu.
4. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce que l’étape de comparaison (5.4,
5.6) détermine un niveau de similitude entre les contenus, et en ce que l’étape d’association associe également une information représentative de la similitude entre les contenus.
5. Procédé d’identification de contenu audio selon la revendication 4 ; caractérisé en ce que l’étape de comparaison (5.4, 5.6) détecte des redondances de certains contenus à des moments périodiques déterminés, l’étape d’association associe alors également une donnée signifiant le caractère périodique des similitudes des contenus émis par deux sources différentes.
6. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce qu’il comporte les étapes ultérieures suivantes exécutées au niveau d’un récepteur (10) :
- émission (5.9) vers le serveur (1) d’une requête comportant une dénomination d’un flux audio,
- réception en provenance dudit serveur (1) d’un message contenant au moins un identifiant d’une source émettant le flux audio identifié,
- présentation de l’au moins un identifiant sur un interface à des fins de sélection de la source pour recevoir ledit flux.
7. Procédé d’identification de contenu audio selon les revendications 4 et 6 ; caractérisé en ce que le message transmis au récepteur (10) contient également l’information représentative de la similitude entre les contenus, et en ce que l’étape de présentation de chaque identifiant présente également pour chaque identifiant ladite information représentative de la similitude entre les contenus.
8. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce que des identifiants différents de sources sont associés à des dénominations différentes, ces sources émettant le même contenu audio.
9. Procédé d’identification de contenu audio selon l’une quelconque des revendications précédentes ; caractérisé en ce qu’il comporte une étape d’évaluation de la validité d’au moins deux dénominations associées à un même contenu émis par deux sources différentes, l’étape d’association associant les identifiants de ces sources différentes avec la dénomination ayant la valeur de validité la plus grande.
10. Serveur d’identification (1) de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs ; caractérisé en ce qu’il comporte un moyen de collecte (2, 3, 4, 5) des identifiants de sources et d’au moins une dénomination associée au contenu émis par chacune de ces sources, un moyen de réception (4, 5) de segments du flux audio émis par chacune de ces sources en utilisant leurs identifiants de source, un moyen de comparaison (2, 3) d’informations représentatives du contenu audio de chaque segment, afin de déterminer des identités de contenus et une mémoire (7) pour enregistrer les associations des identifiants de sources audio émettant le même contenu avec au moins une dénomination.
11. Récepteur (10) de contenus audio émis par une pluralité de sources audio identifiées, lesdites sources émettant un flux audio ayant une dénomination présentée au niveau de récepteurs d’utilisateurs, ledit récepteur comportant des moyens de réception des contenus audio transmis dans le flux et des moyens de reproduction desdits contenus ; caractérisé en ce qu’il comporte en outre un moyen d’émission d’une requête vers un serveur distant contenant une dénomination de contenu afin de recevoir une liste des identifiants de sources audio émettant le contenu identifié par cette dénomination, un moyen d’affichage de la liste reçue et un moyen de sélection d’une des sources affichées afin de lancer la reproduction du contenu émis par cette source.
PCT/EP2020/076072 2019-09-26 2020-09-18 Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé WO2021058384A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FRFR1910617 2019-09-26
FR1910617A FR3101451B1 (fr) 2019-09-26 2019-09-26 Procédé d’identification de flux audio provenant d’une pluralité de sources, système, récepteur et programme associé au procédé

Publications (1)

Publication Number Publication Date
WO2021058384A1 true WO2021058384A1 (fr) 2021-04-01

Family

ID=69375451

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2020/076072 WO2021058384A1 (fr) 2019-09-26 2020-09-18 Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé

Country Status (2)

Country Link
FR (1) FR3101451B1 (fr)
WO (1) WO2021058384A1 (fr)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088900A2 (fr) * 2000-05-15 2001-11-22 Creative Technology Ltd. Procede d'identification de contenu audio
EP1741047A2 (fr) 2004-04-05 2007-01-10 Lebrat, François Procédé de recherche de contenu, notamment d'extraits communs entre deux fichiers informatiques
US20170019196A1 (en) * 2011-08-30 2017-01-19 Iheartmedia Management Services, Inc. Identification of changed broadcast media items
WO2017064400A1 (fr) * 2015-10-12 2017-04-20 Tdf Enrichissement contextuel par reconnaissance audio
EP3373485A1 (fr) * 2017-03-10 2018-09-12 Alps Electric Co., Ltd. Appareil de réception de diffusion, procédé de commande associé et programme de commande associé

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088900A2 (fr) * 2000-05-15 2001-11-22 Creative Technology Ltd. Procede d'identification de contenu audio
EP1741047A2 (fr) 2004-04-05 2007-01-10 Lebrat, François Procédé de recherche de contenu, notamment d'extraits communs entre deux fichiers informatiques
US20170019196A1 (en) * 2011-08-30 2017-01-19 Iheartmedia Management Services, Inc. Identification of changed broadcast media items
WO2017064400A1 (fr) * 2015-10-12 2017-04-20 Tdf Enrichissement contextuel par reconnaissance audio
EP3373485A1 (fr) * 2017-03-10 2018-09-12 Alps Electric Co., Ltd. Appareil de réception de diffusion, procédé de commande associé et programme de commande associé

Also Published As

Publication number Publication date
FR3101451A1 (fr) 2021-04-02
FR3101451B1 (fr) 2021-10-01

Similar Documents

Publication Publication Date Title
EP2039159B1 (fr) Procede d'affichage d'une image mosaïque au sein d'un recepteur pour la selection de programmes audiovisuels, recepteurs et serveurs associes
KR102044647B1 (ko) 송신 장치 및 방법, 수신 장치 및 방법, 및 송수신 시스템
US7778591B1 (en) Radio with backchannel feedback
AU2012254217B2 (en) System and method for recognizing broadcast program content
US11062331B2 (en) Determining streaming content user consumption
WO2019002359A1 (fr) Procédé de transmission d'un contenu audio interrompu dans un récepteur hybride, système, récepteur et programme associé au procédé
JP2013183327A (ja) コンテンツ提供システム、コンテンツ提供方法、および、コンテンツ編集装置
KR20150024418A (ko) 이동 장치 상의 미디어 식별
CN109509472A (zh) 基于语音平台识别背景音乐的方法、装置及系统
US20160182172A1 (en) Data communication with acoustic signal communication
US10009451B2 (en) Radio locator application
WO2021058384A1 (fr) Procédé d'identification de flux audio provenant d'une pluralité de sources, système, récepteur et programme associé au procédé
JP2007043474A (ja) コンテンツ取得システム、放送受信装置、コンテンツ提供装置およびコンテンツ取得方法
KR101511311B1 (ko) 셋탑박스 제어 기록 및 콘텐츠 검색 기록을 이용한 사용자 맞춤형 광고 제공 시스템 및 방법
US10283128B2 (en) Coded acoustic signal communication with separate code-associated data communication
FR2880765A1 (fr) Systeme et procede de reception d'un flux numerique
EP3391622B1 (fr) Paramétrage géolocalisé pour la diffusion d'un contenu multimédia
WO2020260637A1 (fr) Procédé de transmission d'un contenu audio dans un récepteur hybride en recevant des manifestes émis par un serveur manageur, récepteur et serveur manageur associé
EP3501125B1 (fr) Procédé de synchronisation de deux flux de données ainsi que mise en oeuvre de ce procédé dans un récepteur
WO2017064400A1 (fr) Enrichissement contextuel par reconnaissance audio
US20230136608A1 (en) System and methods for advertisement enhancement
FR2863805A1 (fr) Procede et appareil de prise de vue pour l'enrichissement d'images
FR2947412A1 (fr) Procede de selection et de reproduction d'un document possedant une sequence particuliere et recepteurs et serveurs associes
FR3026593A1 (fr) Procede de diffusion de contenus audio avec programmation des creneaux par les auditeurs
FR2929479A1 (fr) Methode d'emission de donnees additionnelles sur un canal insere dans un reseau de canaux audiovisuels, et un appareil pour emettre de telles donnees additionnelles

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20771580

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20771580

Country of ref document: EP

Kind code of ref document: A1