WO2005073875A1

WO2005073875A1 - Systeme et procede de reconnaissance de sequence sonore

Info

Publication number: WO2005073875A1
Application number: PCT/FR2005/000055
Authority: WO
Inventors: Guillaume Decugis
Original assignee: Musiwave Sa
Priority date: 2004-01-16
Filing date: 2005-01-11
Publication date: 2005-08-11
Also published as: EP1706831A1; FR2865298A1; FR2865298B1

Abstract

L'invention concerne un terminal mobile (100), caractérisé en ce qu'il comporte des moyens de gestion (130) contenant une application apte à exécuter automatiquement les étapes suivantes : commander l'établissement d'une connexion entre le terminal mobile (100) et un serveur de reconnaissance de séquence sonore distant (200), après établissement de la connexion, commander la transmission au serveur (200) d'une séquence sonore, en vue de l'identification par le serveur (200) de ladite séquence sonore.

Description

SYSTEME ET PROCEDE DE RECONNAISSANCE DE SEQUENCE SONORE

L'invention concerne un procédé et un système pour fournir à un usager d'un réseau de téléphonie mobile des informations ou des services relativement à une séquence sonore qu'il écoute. Les personnes qui écoutent un morceau de musique, par exemple un morceau diffusé à la radio ou dans un lieu public, souhaitent parfois obtenir des informations concernant le morceau qu'ils écoutent. Ils souhaitent par exemple connaître le titre ou l'interprète du morceau diffusé en vue de pouvoir éventuellement se procurer le morceau de musique. Le document WO 02/27600 (publié le 4 avril 2002) décrit un système permettant à un utilisateur d'obtenir des informations concernant une séquence sonore qu'il écoute. La séquence sonore est transmise à un serveur vocal interactif (IVR) par un dispositif de capture, par exemple un terminal mobile. Le serveur IVR détermine des caractéristiques (empreinte) de la séquence sonore ainsi transmise. Il compare ces caractéristiques avec des caractéristiques stockées dans une base de données et associées à des séquences sonores prédéterminées. En fonction de cette comparaison, le serveur IVR renvoie à l'utilisateur des informations relatives à la séquence sonore identifiée. L'utilisateur peut également grâce à ce système obtenir des services supplémentaires, comme par exemple acheter le morceau de musique identifié. Avec un tel système, l'utilisateur doit être en mesure d'établir une connexion à partir de son terminal mobile avec le serveur IVR, par exemple en composant un numéro spécial. Il doit en outre transmettre en temps réel au serveur la séquence sonore qu'il écoute. L'utilisateur doit également être capable d'interagir avec le serveur IVR pour obtenir des services supplémentaires. En outre, le serveur IVR est un serveur complexe car il doit être en mesure d'échanger et de traiter des données sous forme vocale avec l'utilisateur. Un but de l'invention est de proposer un système permettant un accès facilité aux services de reconnaissance de séquence sonore. A cet effet, l'invention propose un terminal mobile, caractérisé en ce qu'il comporte des moyens de gestion contenant une application apte à exécuter automatiquement les étapes suivantes : - commander l'établissement d'une connexion entre le terminal mobile et un serveur de reconnaissance de séquence sonore distant, - après établissement de la connexion, commander la transmission au serveur d'une séquence sonore, en vue de l'identification par le serveur de ladite séquence sonore. Le terminal mobile est apte à réaliser automatiquement la connexion au serveur distant de reconnaissance de séquence sonore et la transmission de la séquence sonore à identifier, de sorte que l'utilisateur n'a pas à effectuer de manipulations particulières. En particulier, il n'a pas à composer de numéro spécial de connexion. Le service de reconnaissance de séquence sonore est facile d'accès pour l'utilisateur. En outre, l'utilisateur interagit avec son terminal et non pas avec le serveur distant. L'interaction avec le serveur distant est gérée par les moyens de gestion au sein du terminal. L'accès au service de reconnaissance de séquence sonore se présente de manière ergonomique pour l'utilisateur. Dans une mise en œuvre de l'invention, le terminal comporte des moyens mémoire aptes à enregistrer une séquence sonore et l'application est apte à commander l'enregistrement de la séquence sonore par les moyens mémoire avant de commander l'établissement d'une connexion entre le terminal mobile et le serveur de reconnaissance de séquence sonore distant. Ainsi, dans le cas où l'application rencontre des difficultés à établir une connexion avec le serveur de reconnaissance de séquence sonore distant, elle peut renouveler automatiquement la connexion ultérieurement. En outre, le terminal peut convertir la séquence sonore enregistrée pour la transmettre au serveur de reconnaissance de séquence sonore distant sous une forme appropriée en vue de son identification par le serveur, par exemple sous forme de paquets de données. Dans cette mise en œuvre, le serveur de reconnaissance de séquence sonore ne nécessite pas de moyens pour échanger et traiter des données sous forme vocale. Dans une autre mise en œuvre de l'invention, l'application est apte à exécuter la transmission de la séquence sonore en temps réel par audio streaming (transmission en continu de la séquence sonore à mesure que celle-ci est générée). Dans une autre mise en œuvre de l'invention, l'application est apte à commander la détermination par les moyens de gestion d'une signature de la séquence sonore et à exécuter la transmission de cette signature en temps réel par audio streaming (transmission en continu à mesure que la signature est générée). Dans une autre mise en œuvre de l'invention, le terminal comporte des moyens mémoire aptes à enregistrer une séquence sonore et l'application est apte à commander l'enregistrement de la séquence sonore par les moyens mémoire. L'application est apte à commander ensuite la détermination par les moyens de gestion d'une signature de la séquence sonore en vue de la transmission de cette signature au serveur de reconnaissance de séquence sonore. Dans cette mise en œuvre, la séquence sonore est transmise au serveur de reconnaissance de séquence sonore directement sous une forme appropriée (signature) pour que le serveur exécute son identification. Le serveur de reconnaissance de séquence sonore ne nécessite pas de moyens pour convertir la séquence sonore en signature. L'invention se rapporte également à un procédé de reconnaissance de séquence sonore, caractérisé en ce qu'il comprend le lancement d'une application contenue dans des moyens de gestion d'un terminal mobile, ladite application exécutant automatiquement les étapes suivantes : - commander l'établissement d'une connexion entre le terminal mobile et un serveur de reconnaissance de séquence sonore distant, - après établissement de la connexion, commander la transmission au serveur d'une séquence sonore, en vue de l'identification par le serveur de ladite séquence sonore. D'autres caractéristiques et avantages de l'invention ressortiront encore de la description qui suit. Cette description illustre un mode de mise en œuvre possible de l'invention. Elle doit être lue en regard des figures annexées parmi lesquelles : - la figure 1 est une représentation schématique d'un mode de mise en œuvre d'un système de reconnaissance de séquence sonore selon l'invention, - la figure 2 est une représentation schématique des différentes étapes du procédé de reconnaissance de séquence sonore conforme à un mode de mise en œuvre de l'invention. Sur la figure 1 , le système de reconnaissance de séquence sonore comprend un terminal mobile 100, un serveur de reconnaissance de séquence sonore distant 200 et un serveur de services 300. Le terminal mobile 100 comprend des moyens 110 pour capturer une séquence sonore, sous la forme d'un microphone, des moyens mémoire 130 pour enregistrer la séquence sonore capturée, des moyens de gestions 120 sous la forme d'un microprocesseur et des moyens d'émission/réception 140, sous la forme d'une antenne. Les moyens de gestion 120 contiennent une application permettant de déclencher automatiquement les différentes étapes de reconnaissance de séquence sonore. Les moyens de gestion 120 commandent l'affichage sur l'écran 150 du terminal mobile 100 d'un lien correspondant au service de reconnaissance de séquence sonore. Le lien se présente sous la forme d'une icône spécifique que l'utilisateur peut sélectionner pour lancer l'exécution de l'application. Lors de l'activation du lien par l'utilisateur, les moyens de gestion 130 déclenchent l'application. Le serveur de reconnaissance de séquence sonore 200 est relié à une base de données 210 contenant un ensemble de signatures de séquence sonores ainsi que des données d'identification associées à chacune de ces séquences sonores. Le serveur de service 300 est apte à exécuter des services relatifs à des séquences sonores identifiées et à enregistrer des données nécessaires pour la facturation de ces services. Ces services consistent par exemple à obtenir des informations relatives à la séquence sonore identifiée, acheter un contenu mobile associé à la séquence sonore identifiée ou acheter un produit en relation avec la séquence sonore identifiée. A cet effet, le serveur de services 300 est connecté à un ensemble de serveurs 310, 320, 330 spécialisés. Le serveur spécialisé 310 est par exemple relié à une base de données de contenus mobiles et est apte à fournir un contenu mobile en fonction d'informations d'identifications qui lui sont transmises. Le procédé de reconnaissance sonore va être décrit en relation avec les figures 1 et 2. Un utilisateur entend une séquence sonore S qui l'intéresse et souhaite obtenir des informations ou des services relativement à cette séquence sonore. Selon une première étape 10, l'utilisateur déclenche l'exécution de l'application de reconnaissance de séquence sonore en sélectionnant l'icône correspondante sur son terminal mobile 100. La sélection de l'icône a pour effet de déclencher l'application de reconnaissance de séquence sonore qui exécute de manière automatique les étapes suivantes. Selon une étape 20, l'application commande l'enregistrement de la séquence sonore S par les moyens mémoire 130 du terminal mobile 100. Selon une étape 30, l'application poursuit l'enregistrement pendant une durée d'enregistrement prédéterminée, par exemple de 15 secondes. Cette durée d'enregistrement prédéterminée dépend des performances de reconnaissance recherchées. Selon une étape 40, après l'écoulement de ladite durée d'enregistrement prédéterminée, l'application commande l'établissement d'une connexion Internet entre le terminal mobile 100 et le serveur de reconnaissance de séquence sonore distant 200. Selon une étape 50, lorsque la connexion avec le serveur est établie, l'application commande la transmission de la séquence sonore enregistrée dans les moyens mémoire 130 au serveur de reconnaissance de séquence sonore distant 200. A cet effet, la séquence sonore peut être compressée au préalable et être transmise sous forme de paquets de données. Alternativement, la séquence sonore peut être transmise par audio streaming. Le serveur de reconnaissance de séquence sonore 200 détermine une signature de la séquence sonore ainsi transmise et compare cette signature avec les signatures contenues dans la base de données 210. Si le résultat de cette comparaison est positif, c'est à dire que le serveur 200 a trouvé parmi les signatures contenues dans la base de donnée une signature correspondante, le serveur 200 renvoie un signal au terminal mobile 100 indiquant qu'il a identifié la séquence sonore et contenant une référence associée à la séquence sonore ainsi identifiée. Selon une étape 60, le terminal mobile 60 attend de recevoir le signal d'identification de la part du serveur de reconnaissance de séquence sonore 200. Selon une étape 70, lorsque le terminal mobile a reçu le signal d'identification, l'application commande l'enregistrement de la référence associée à la séquence sonore dans les moyens mémoires 130 et l'affichage sur l'écran 150 du terminal mobile 100 d'un menu comprenant une série de propositions de services relatifs à la séquence sonore identifiée, lesdites propositions pouvant être sélectionnées par l'utilisateur. Le menu affiché comprend les propositions suivantes : 1/ obtenir des informations relatives à la séquence sonore identifiée, 2/ acheter un contenu mobile associé à la séquence sonore identifiée, 3/ acheter un produit en relation avec la séquence sonore identifiée. Selon une étape 80, l'utilisateur sélectionne l'une parmi les propositions de service affichées. Si l'utilisateur sélectionne la proposition 1/, cela signifie qu'il souhaite obtenir des informations d'identification relatives à la séquence sonore. Par exemple, si la séquence sonore est une chanson, il pourra obtenir le titre, l'interprète, le titre de l'album contenant la chanson, le prix de l'album et toute autre information utile. Si l'utilisateur sélectionne la proposition 21, cela signifie qu'il souhaite acheter un contenu mobile associé à la séquence sonore identifiée. Par exemple, si la séquence sonore est une chanson, il pourra obtenir une sonnerie et un fond d'écran correspondant à la chanson. Si l'utilisateur sélectionne la proposition 3/, cela signifie qu'il souhaite acheter un produit en relation avec la séquence sonore identifiée, par exemple un disque. Selon l'étape 90, l'application commande l'envoi d'un message contenant une requête correspondant à la proposition de service sélectionnée vers le serveur de service 300 en vue de l'exécution du service correspondant. Le message contient également la référence associée à la séquence sonore identifiée. Le message peut être envoyé sous la forme d'un message SMS ou toute autre forme appropriée. On suppose par exemple que l'utilisateur a sélectionné la proposition 2/ correspondant à l'obtention d'un contenu mobile. Le serveur de service 300 reçoit la requête et transmet la référence au serveur de contenu mobile 310. A partir de la référence, le serveur de contenu 310 est apte à retrouver dans la base de données 350 le contenu mobile correspondant. Le serveur de service 300 transmet au terminal 100 le contenu mobile. Le serveur de service 300 est également apte à réaliser les différentes opérations d'authentification et d'enregistrement pour permettre une facturation de la transmission de contenu mobile à l'utilisateur. De manière avantageuse, les moyens mémoire 130 du terminal mobile 100 contiennent les références des dix dernières séquences sonores identifiées par le serveur de reconnaissance de séquence sonore 200 à la demande de l'utilisateur. Ainsi, chaque fois que l'utilisateur lance l'application, il peut accéder directement à des services relatifs à des séquences sonores déjà identifiées. On a décrit une mise en œuvre du procédé de reconnaissance de séquence sonore dans laquelle l'application exécute les étapes 20 et 30 consistant à enregistrer la séquence sonore par les moyens mémoire 130, avant de commander l'établissement d'une connexion entre le terminal mobile 100 et le serveur de reconnaissance de séquence sonore distant 200. Dans une autre mise en œuvre, la séquence sonore à identifier n'est pas enregistrée dans des moyens mémoires avant d'être transmise au serveur de reconnaissance de séquence sonore 200. La séquence est transmise en temps réel au serveur de reconnaissance de séquence sonore par audio streaming (transmission en continu de la séquence sonore à mesure que celle-ci est capturée par le microphone). Dans une autre mise en œuvre encore, l'application la séquence sonore à identifier n'est pas enregistrée dans des moyens mémoires avant d'être transmise au serveur de reconnaissance de séquence sonore 200. L'application commande la détermination par les moyens de gestion 120 d'une signature de la séquence sonore et la transmission de cette signature au serveur de reconnaissance de séquence sonore 200, à mesure que cette signature est générée. Dans une autre mise en œuvre encore, l'application exécute les étapes 20 et 30 consistant à enregistrer la séquence sonore dans les moyens mémoire 130, puis commande la détermination par les moyens de gestion 120 d'une signature de la séquence sonore enregistrée et la transmission de cette signature au serveur de reconnaissance de séquence sonore 200. Dans ces deux dernières mises en œuvre, la séquence sonore est transmise au serveur de reconnaissance de séquence sonore 200 sous une forme appropriée pour que le serveur exécute directement une comparaison avec les signatures contenues dans la base de données 210. Dans cette mise en œuvre, une partie du procédé de reconnaissance est exécutée par le terminal de sorte que le serveur de reconnaissance de séquence sonore est déchargé de cette partie du procédé. En outre, une fois la séquence sonore convertie en signature, la largeur de bande passante nécessaire pour transmettre la séquence sonore convertie est plus faible que celle qui est nécessaire pour transmettre directement la séquence sonore non convertie. Par ailleurs, dans le cadre de l'invention, il peut être prévu que l'utilisateur puisse fournir au serveur de reconnaissance de séquence sonore 200 des données relatives à la séquence sonore qui l'intéresse pour en faciliter son identification. Par exemple, l'utilisateur peut utiliser le système de reconnaissance lorsque ce n'est pas l'identification de la séquence sonore qui l'intéresse en soi mais les différents services associés à cette séquence sonore. De manière avantageuse, les données fournies par l'utilisateur peuvent être utilisées par le serveur de reconnaissance de séquence sonore 200 pour compléter la base de données 210 ou confirmer/modifier les informations qu'elle contient déjà.

Claims

REVENDICATIONS

1. Terminal mobile (100), caractérisé en ce qu'il comporte des moyens de gestion (120) contenant une application apte à exécuter automatiquement les étapes suivantes : - commander l'établissement d'une connexion entre le terminal mobile (100) et un serveur de reconnaissance de séquence sonore distant (200), - après établissement de la connexion, commander la transmission au serveur (200) d'une séquence sonore, en vue de l'identification par le serveur (200) de ladite séquence sonore.

2. Terminal selon la revendication 1 , dans lequel les moyens de gestion (120) sont aptes à commander l'affichage sur un écran (150) du terminal mobile (100) d'un lien correspondant à un service de reconnaissance de séquence sonore, et sont aptes lors de l'activation du lien à déclencher l'application.

3. Terminal selon l'une des revendications 1 ou 2, dans lequel l'application est apte à commander la transmission de la séquence au serveur de reconnaissance de séquence sonore (200) en continu, à mesure que cette séquence est générée.

4. Terminal selon l'une des revendications 1 ou 2, dans lequel l'application est apte à commander la détermination par les moyens de gestion (120) d'une signature de la séquence sonore et la transmission de cette signature au serveur de reconnaissance de séquence sonore (200), à mesure que cette signature est générée.

5. Terminal mobile selon l'une des revendications 1 ou 2, comportant des moyens mémoire (130) aptes à enregistrer une séquence sonore et dans lequel l'application est apte à commander l'enregistrement de la séquence sonore par les moyens mémoire (130) avant de commander l'établissement d'une connexion entre le terminal mobile (100) et le serveur de reconnaissance de séquence sonore distant (200).

6. Terminal selon la revendication 5, dans lequel l'application est apte à commander l'enregistrement de la séquence sonore par les moyens mémoires (130) pendant une durée d'enregistrement prédéterminée et après l'écoulement de ladite durée d'enregistrement prédéterminée, à commander l'établissement d'une connexion entre terminal mobile (100) et le serveur distant (200) pour transmettre la séquence sonore au serveur.

7. Terminal selon l'une des revendications 5 ou 6, dans lequel l'application est apte à commander la détermination par les moyens de gestion (120) d'une signature de la séquence sonore enregistrée et la transmission de cette signature au serveur de reconnaissance de séquence sonore (200).

8. Terminal selon l'une des revendications qui précèdent, dans lequel l'application exécute en outre l'étape suivante : - lorsque le serveur (200) a identifié la séquence sonore, afficher, sur un écran (150) du terminal (100), un menu comprenant une série de propositions de services relatifs à la séquence sonore identifiée, lesdites propositions pouvant être sélectionnées en vue de l'exécution du service correspondant.

9. Terminal selon la revendication 8, dans lequel ledit menu comprend l'une des propositions suivantes : obtenir des informations relatives à la séquence sonore identifiée, acheter un contenu mobile associé à la séquence sonore identifiée, acheter un produit en relation avec la séquence sonore identifiée.

10. Terminal selon l'une des revendication 8 ou 9, dans lequel si l'une des propositions est sélectionnée, l'application exécute l'étape suivante : - déclencher l'envoi d'un SMS contenant une requête correspondant à la proposition de service sélectionnée vers un serveur de service (300) apte à exécuter le service.

11. Terminal selon l'une des revendications qui précèdent, dans lequel la connexion entre le terminal (100) et le serveur de reconnaissance de séquence sonore distant (200) est une connexion Internet.

12. Procédé de reconnaissance de séquence sonore, caractérisé en ce qu'il comprend le lancement d'une application contenue dans des moyens de gestion (120) d'un terminal mobile (100), ladite application exécutant automatiquement les étapes suivantes : - commander l'établissement d'une connexion entre le terminal mobile (100) et un serveur de reconnaissance de séquence sonore distant (200), - après établissement de la connexion, commander la transmission au serveur (200) d'une séquence sonore, en vue de l'identification par le serveur (200) de ladite séquence sonore.

13. Procédé selon la revendication 12, comprenant l'étape préalable consistant à afficher sur un écran (150) du terminal mobile (100) un lien correspondant à un service de reconnaissance de séquence sonore, et lors de l'activation du lien, déclencher l'application.

14. Procédé selon l'une des revendications 12 ou 13, dans lequel l'application exécute l'étape consistant à commander la transmission de la séquence au serveur de reconnaissance de séquence sonore (200) en continu, à mesure que cette séquence est générée.

15. Procédé selon l'une des revendications 12 ou 13, dans lequel l'application commande la détermination par les moyens de gestion (120) d'une signature de la séquence sonore et la transmission de cette signature au serveur de reconnaissance de séquence sonore (200), à mesure que cette signature est générée.

16. Procédé selon l'une des revendications 12 ou 13, dans lequel l'application exécute l'étape consistant à déclencher l'enregistrement de la séquence sonore par des moyens mémoire (130) du terminal mobile (100), avant de commander l'établissement d'une connexion entre le terminal mobile (100) et le serveur de reconnaissance de séquence sonore distant (200).

17. Procédé selon la revendication 16, dans lequel l'application commande l'enregistrement de la séquence sonore par les moyens mémoires (130) pendant une durée d'enregistrement prédéterminée et, après l'écoulement de ladite durée d'enregistrement prédéterminée, l'application commande l'établissement d'une connexion entre terminal mobile (100) et le serveur distant (200).

18. Procédé selon l'une des revendications 16 ou 17, dans lequel l'application exécute l'étape consistant à commander la détermination par les moyens de gestion (120) d'une signature de la séquence sonore enregistrée et la transmission de cette signature au serveur de reconnaissance de séquence sonore (200).

19. Procédé selon l'une des revendications 12 à 18, dans lequel l'application exécute en outre l'étape consistant à, lorsque le serveur de reconnaissance de séquence sonore (200) a identifié la séquence sonore, afficher sur un écran (150) du terminal (100), un menu comprenant une série de propositions de services relatifs à la séquence sonore identifiée, lesdites propositions pouvant être sélectionnées en vue de l'exécution du service correspondant.

20. Procédé selon la revendication 19, dans lequel ledit menu comprend l'une des propositions suivantes : obtenir des informations relatives à la séquence sonore identifiée, acheter un contenu mobile associé à la séquence sonore identifiée, acheter un produit en relation avec la séquence sonore identifiée.

21. Procédé selon l'une des revendications 19 ou 20, dans lequel l'application exécute en outre l'étape consistant à, si l'une des propositions est sélectionnée, déclencher l'envoi d'un SMS contenant une requête correspondant à la proposition sélectionnée vers un serveur de service (300) apte à exécuter le service.

22. Procédé selon l'une des revendications qui précèdent, dans lequel la connexion entre le terminal (100) et le serveur de reconnaissance de séquence sonore distant (200) est une connexion Internet.