FR3011373A1 - Terminal portable d'ecoute haute-fidelite personnalisee - Google Patents

Terminal portable d'ecoute haute-fidelite personnalisee Download PDF

Info

Publication number
FR3011373A1
FR3011373A1 FR1359368A FR1359368A FR3011373A1 FR 3011373 A1 FR3011373 A1 FR 3011373A1 FR 1359368 A FR1359368 A FR 1359368A FR 1359368 A FR1359368 A FR 1359368A FR 3011373 A1 FR3011373 A1 FR 3011373A1
Authority
FR
France
Prior art keywords
listening
audio
user
module
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1359368A
Other languages
English (en)
Inventor
Herve Roux
Vincent Mouret
Matthieu Aussal
Mathieu Coic
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL MEDIA SOLUTIONS
Original Assignee
DIGITAL MEDIA SOLUTIONS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DIGITAL MEDIA SOLUTIONS filed Critical DIGITAL MEDIA SOLUTIONS
Priority to FR1359368A priority Critical patent/FR3011373A1/fr
Publication of FR3011373A1 publication Critical patent/FR3011373A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

L'invention s'applique à un système de reproduction audio haute-fidélité, par exemple le système de traitement binaural. Selon l'invention, pour permettre l'écoute de contenus audio dans des conditions de très haute fidélité, ou de haute réalité, sur des plateformes disposant d'une capacité de calcul et de stockage aujourd'hui limitée et d'une autonomie électrique qui restera encore longtemps contrainte, telles que des téléphones intelligents, il est proposé de réaliser les fonctions de traitement audio, telles que la spatialisation binaurale avec ou sans ajout d'une acoustique de salle sur un serveur distant. L'utilisateur est en mesure de communiquer au serveur les paramètres de la personnalisation du traitement de signal, tels que des données morphologiques ou un audiogramme, à partir de son téléphone intelligent, ledit téléphone pouvant le cas échéant être équipé pour réaliser la capture desdits paramètres. Le traitement de signal paramétré par le profil d'écoute audio de l'utilisateur est ensuite exécuté par le serveur et l'utilisateur peut alors télécharger le contenu audio en sortie du traitement personnalisé pour écoute sur son terminal, par exemple son téléphone intelligent.

Description

TERMINAL PORTABLE D'ECOUTE HAUTE-FIDELITE PERSONNALISEE La présente invention s'applique au domaine des dispositifs de reproduction sonore haute-fidélité, notamment des casques audio. Les utilisateurs souhaitent désormais pouvoir reproduire à partir de leur terminal d'usage courant (téléphone intelligent, tablette, etc...), des sons de très haute fidélité, notamment en écoute au casque. Les capacités de calcul et l'autonomie électrique de ces terminaux restent cependant encore insuffisants pour accommoder une exécution sur ledit terminal de modèles de reproduction sonore spatialisée utilisant notamment des filtres personnalisés de type Head Related Transfer Functions (HRTF) de haute définition, de plus en plus incontournables pour parvenir au niveau de fidélité requis. Les HRTF modélisent la morphologie de la tête d'un utilisateur et produisent par convolution avec un signal audio un rendu spatialisé.. Plus la HRTF est détaillée et proche de la morphologie de l'auditeur, plus l'espace sonore perçu est réaliste. Ces modèles de tête sont en outre combinés avec des modèles d'acoustique de salle en trois dimensions qui permettent d'améliorer grandement le caractère réaliste du rendu acoustique. Les moyens de calcul pour parvenir à un niveau de très haute fidélité compatible avec les attentes des utilisateurs les plus exigeants existent sur les plateformes fixes. En revanche, elles n'existent pas aujourd'hui sur des plateformes mobiles compactes. La présente invention permet de surmonter ces difficultés de l'art antérieur en procurant un système, un procédé et un dispositif qui permettent d'exécuter un traitement du signal adapté, notamment les traitements binauraux et la simulation de l'acoustique d'une salle donnée, sur des machines réparties, ce qui permet de limiter la puissance consommée sur la plateforme locale compacte du type téléphone intelligent ou tablette. Pour parvenir à ce résultat, l'utilisateur transmet aux moyens de calcul par un protocole adapté les paramètres de personnalisation de son profil d'écoute. A cet effet, l'invention divulgue un terminal d'écoute de contenus audio comprenant : un module d'établissement d'une session de communication 35 avec un serveur; un module de téléchargement de contenus audio sur ledit terminal à partir dudit serveur ; un module de reproduction desdits contenus audio par un dispositif d'écoute connecté audit terminal; ledit terminal d'écoute étant caractérisé en ce que : i) le module d'établissement d'une session de communication est configuré pour permettre la sélection par un utilisateur du terminal d'un profil d'écoute audio dudit utilisateur, ledit profil comprenant au moins un paramètre appartenant à un groupe de paramètres comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; et en ce que, ii) le module de téléchargement est configuré pour télécharger du serveur vers le terminal d'écoute au moins un contenu audio en sortie d'une fonction de traitement de signal audio paramétrée par le profil d'écoute audio de l'utilisateur.
L'invention divulgue également un module de personnalisation d'écoute comprenant : un sous-module de capture de paramètres constituant un profil d'écoute audio d'un utilisateur, lesdits paramètres étant choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; un sous-module de transmission dudit profil d'écoute à un serveur; ledit module de personnalisation d'écoute étant caractérisé en ce que ledit sous- module de transmission est configuré pour générer, à partir dudit profil d'écoute, un message interprétable par ledit serveur pour commander l'exécution par un module de traitement audio d'au moins une fonction de traitement de signal audio d'au moins un contenu audio accessible par ledit serveur, ladite fonction de traitement de signal audio étant paramétrée par le profil d'écoute de l'utilisateur. Avantageusement, dans le terminal d'écoute de l'invention, ladite au moins une fonction de traitement de signal audio est une fonction de spatialisation binaurale d'au moins un contenu audio.35 Avantageusement, dans le terminal d'écoute de l'invention, ladite au moins une fonction de traitement de signal audio est une fonction d'adaptation à une acoustique tri-dimensionnelle d'un lieu d'écoute.
Avantageusement, le terminal d'écoute de l'invention comprend en outre un module de personnalisation. Avantageusement, le module de personnalisation de l'invention comprend en outre un sous-module de prise de vues de la tête de l'utilisateur, lesdites 10 vues étant choisies pour permettre une détermination de paramètres significatifs du profil d'écoute au casque dudit utilisateur. Avantageusement, le module de personnalisation de l'invention comprend en outre un sous-module de capture d'un audiogramme de l'utilisateur. 15 L'invention divulgue également un serveur de contenus audio comprenant : un module d'acquisition de profils d'écoute audio d'utilisateurs, lesdits profils comprenant, pour chaque utilisateur, des paramètres choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres 20 fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute simulé, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; un module d'établissement de sessions de communication par lesdits utilisateurs ; un module de traitement audio ; un module de téléchargement de contenus 25 audio par lesdits utilisateurs vers le dispositif d'écoute ; ledit serveur de contenus étant caractérisé en ce que : i) le module d'établissement de sessions de communication est configuré pour permettre à un utilisateur d'exécuter une fonction d'activation d'un profil d'écoute audio choisie dans un groupe comprenant une transmission, une sélection et une validation dudit 30 profil d'écoute audio; et en ce que, ii) le module de traitement audio est configuré pour exécuter au moins une fonction de traitement de signal audio paramétrée par la sortie de la fonction d'activation du profil audio ; et en ce que, iii) le module de téléchargement de contenus audio est configuré pour fournir à l'utilisateur un contenu audio en sortie de ladite au moins une 35 fonction de traitement de signal audio paramétrée.
Avantageusement, dans le serveur de contenus audio de l'invention, ladite au moins une fonction de traitement de signal audio fait appel à des fonctions HRTF.
Avantageusement, dans le serveur de contenus audio de l'invention, les fonctions HRTF auxquelles ladite fonction de traitement de signal audio fait appel dépendent du profil d'écoute audio de l'utilisateur.
Avantageusement, dans le serveur de contenus audio de l'invention, les fonctions HRTF sont calculées aux points de provenance des sons spatialisés par interpolation des résidus des mesures après soustraction des valeurs en ces points du modèle de mesure correspondant au profil d'écoute audio de l'utilisateur.
L'invention divulgue également un protocole de transmission d'un message comprenant des paramètres caractérisant un profil d'écoute audio d'un utilisateur d'un dispositif d'écoute de contenus audio, ledit protocole étant caractérisé en ce que lesdits paramètres sont choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute simulé, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur .
Avantageusement, dans le protocole de transmission de l'invention, ledit message est transmis à un module de traitement audio résidant sur un serveur pour déclencher l'exécution d'au moins une fonction de traitement de signal audio paramétrée par le profil d'écoute audio de l'utilisateur.
Avantageusement, dans le protocole de transmission de l'invention, ledit déclenchement est commandé par l'utilisateur à partir d'un terminal d'écoute audio, ledit terminal exécutant ensuite une procédure de téléchargement d'au moins un contenu audio en sortie de la au moins une fonction de traitement de signal audio. 3 0 1 13 73 5 Selon l'invention, les traitements les plus demandeurs en puissance de calcul, tels que le calcul des coefficients des HRTF, les convolutions de signaux audio-multicanaux par les HRTFs et les réponses de salles en trois dimensions sont effectués sur un serveur auquel la plateforme compacte se 5 connecte. Pour des contenus multicanaux, il est de même nécessaire d'utiliser des capacités de stockage communes au voisinage dudit serveur et non les capacités de l'appareil mobile compact qui seraient insuffisantes au regard des besoins nécessaires. En outre, l'architecture de l'invention permet de minimiser les travaux de portage des applications qui ne doivent être 10 adaptées qu'aux plateformes matérielles et logicielles du serveur choisi et non aux multiples plateformes et "operating systems" utilisables comme clients. Enfin, dans cette architecture, l'utilisateur jouit d'une grande liberté pour configurer la librairie audio du périphérique et choisir le niveau de qualité de rendu audio qu'il souhaite, notamment en fonction de la qualité du 15 casque de reproduction dont il dispose. L'invention sera mieux comprise, ses différentes caractéristiques et avantages ressortiront de la description qui suit de plusieurs exemples de réalisation et de ses figures annexées dont : 20 - La figure 1 représente un schéma de principe de la mise en oeuvre l'invention selon plusieurs de ses modes de réalisation ; - La figure 2 représente un schéma de principe d'une architecture fonctionnelle pour mettre en oeuvre l'invention selon plusieurs de ses modes de réalisation ; 25 - La figure 3 représente un organigramme des traitements pour mettre en oeuvre l'invention selon plusieurs de ses modes de réalisation. La figure 1 représente un schéma de principe d'une architecture fonctionnelle pour mettre en oeuvre l'invention selon plusieurs de ses modes de 30 réalisation. Selon l'invention, un ensemble de serveurs 101 comprenant notamment des modules adaptés de traitement de signal audio, est en mesure de réaliser un encodage binaural en temps réel de flux audio entreposés dans une capacité de stockage 102 et sélectionnés par un utilisateur 103. Cet encodage est 35 réalisé en utilisant des paramètres de personnalisation propres audit utilisateur, au terminal 104 doté d'un casque d'écoute 105 qu'il utilise, et également au lieu virtuel d'écoute. L'encodage binaural ou 3D permet à un utilisateur de ressentir les sons reproduits par son casque d'écoute comme spatialisés, c'est-à-dire 5 provenant d'une direction donnée. Un front d'onde sonore émis par une source parcourt des chemins différents pour parvenir aux oreilles droite et gauche de l'utilisateur. Ces différences de chemin sont interprétées par le cerveau qui va alors identifier la provenance du front d'onde. La fidélité de reproduction de l'espace sonore est une 10 caractéristique que les mélomanes, notamment, attendront d'un casque haute-fidélité. En outre, l'onde sonore interfère avec les différentes parties de la tête de l'utilisateur rencontrées en chemin comme le nez ou les éléments de l'oreille. Des fonctions de transfert HRTF sont des mesures de ces interférences et sont appliquées aux deux voies d'écoute d'un casque de 15 haute-fidélité de sorte que l'utilisateur reconstitue ainsi la localisation de la source sonore. Pour une localisation donnée (en distance, azimut et élévation), il existe une fonction de transfert par oreille. Les fonctions HRTF sont les transformées de Fourier des réponses impulsionnelles de la tête aux ondes sonores (en anglais, Head-Related Impulse Response ou HRIR). Il 20 existe une fonction HRTF/HRIR par utilisateur, les coefficients de la fonction dépendant essentiellement de la morphologie de sa tête et de son buste. En outre, dans une chaîne de traitement binaural efficace, il est avantageux de prendre en compte une acoustique de salle pour améliorer le rendu de la reproduction. En effet, les HRTFs sont données avec des ondes sonores 25 émises dans une chambre sourde (ou anéchoïques) où les réflexions de l'onde sur les parois de la chambre sont annulées. Ce sont des conditions expérimentales qui ne se rencontrent pas dans la vie quotidienne. L'ajout d'une acoustique de salle permet de placer l'auditeur dans un environnement plus familier qu'une chambre sourde. Enfin, les caractéristiques du terminal, 30 de la liaison et du casque utilisés par l'utilisateur seront également avantageusement pris en compte. Plusieurs modalités techniques et organisationnelles de personnalisation sont envisageables pour mettre en oeuvre l'invention. Elles seront commentées en relation avec la figure 3. De manière générique, on indiquera 35 seulement à ce stade qu'elles reposent en règle générale sur une identification de l'utilisateur qui connecte un terminal 104 à un serveur 101 et une exécution par ledit serveur des algorithmes mis en oeuvre par les procédures de personnalisation du traitement des signaux audio. Lorsqu'un couple contenu sélectionné par un utilisateur/paramètres de configuration 5 dudit utilisateur n'est pas déjà présent sur le serveur, ladite personnalisation s'effectue à la volée en mode streaming sur les contenus sélectionnés par l'utilisateur, à partir des paramètres de configuration fournis au serveur. On peut envisager qu'un couple contenu/paramètres de configuration soit conservé sur le serveur pour une durée limitée, le cas échéant dans le cadre 10 d'une limite de capacité, celle-ci étant éventuellement ajustable en fonction d'un niveau d'abonnement dudit utilisateur. La figure 2 représente un schéma de principe d'une architecture fonctionnelle pour mettre en oeuvre l'invention selon plusieurs de ses modes de 15 réalisation. Pour mettre en oeuvre l'invention, une librairie 201 de procédures de traitement des contenus audio 206 réalise par exemple et notamment les fonctions suivantes qui sont décrites ci-après. Les flux audio sont conditionnés à un format, par exemple de deux fois 32 bits, à une fréquence 20 d'échantillonnage, par exemple de 48 kHz. La librairie comprendra les routines de calcul des HRTF qui seront appliquées aux contenus audio après capture des paramètres de personnalisation. Les HRTF peuvent être des fonctions classiques, dont les coefficients sont simplement générés à partir de mesures réalisées en un certain nombre de points d'une sphère centrée 25 sur l'utilisateur. De manière plus efficace, elles peuvent être également déduites d'un modèle morphologique selon la méthode objet de la demande de brevet n°FR12/62945 appartenant à la demanderesse. Selon cette invention, les coefficients calculés à partir d'une tête modélisée sont déduits des mesures effectuées aux points de la sphère et l'interpolation est réalisée 30 uniquement sur les résidus, ce qui diminue à la fois grandement les artefacts et la taille de la base de données nécessaire aux calculs des HRTF personnalisées. Un rajout d'acoustique de salle par traitement ambisonique binauralisé (par exemple, de type HOA - High Order Ambisonic - d'ordre 1) peut être appliqué pour améliorer la perception du rendu spatial par rapport à 3 0 1 1 3 7 3 8 celui correspondant au format dans lequel les contenus sont normalement stockés par les diffuseurs de contenus. Les procédures 201 doivent pouvoir être appelées par des messages 202 5 générés par les terminaux utilisateurs utilisant un protocole commun. Il est envisageable d'utiliser un protocole propriétaire d'un fournisseur de contenu, tel i-TunesTm, ou un avec un protocole ouvert, par exemple une des multiples implémentations de l'OSC (Open Sound Control). Quelle que soit la solution choisie, les principales fonctions qui devront pouvoir être 10 commandées par l'utilisateur et exécutées sur le serveur sont par exemple : - L'authentification de l'utilisateur et, éventuellement, l'accès à son compte sur le serveur, ledit compte pouvant déjà disposer de tout ou partie des informations nécessaires à la personnalisation de l'écoute ; - Le choix du titre par l'utilisateur ; 15 - L'activation du mode binaural ; - L'activation d'un effet de salle, 208 ; - Le choix d'une base HRTF, 207 ; - Le cas échéant, le choix de paramètres morphologiques ou de photographies de l'utilisateur et des caractéristiques du casque. Si ces 20 données ne sont pas déjà disponibles sur le compte de l'utilisateur ; dans un mode de réalisation, on peut envisager que l'acquisition de ces paramètres soit automatique ou semi-automatique ; - Le cas échéant, le choix d'un ratio entre effet de salle en trois dimensions (réverbérant) et effet binaural seul (anéchoïque). 25 - Le contrôle de transport du flux audio, notamment lecture, pause, avance de X secondes, retour de Y secondes. L'utilisation du protocole OSC se fait par exemple avec la librairie "oscpack". Cette librairie gère la connexion entre client et serveur pour l'envoi de paquets OSC. Pour activer les différents contrôles, des messages OSC 30 propres à chaque paramètre sont créés et le module de reproduction des contenus doit être configuré pour pouvoir recevoir en entrée des fichiers traités par les procédures de la librairie 202 en fonction des contenus des messages reçus. Le contrôle de transport du flux audio agit directement sur le flux audio. 35 3 0 1 1 3 7 3 9 Une procédure 203 réalise la gestion du flux audio qui comprend par exemple : - Un décodage des fichiers audio par le décodeur adapté au format de stockage (format propriétaire, standardisé ou libre, du type FFmpeg) ; - Un encodage du flux en sortie du traitement binaural par le codeur correspondant dans un format mp3, par exemple à 192 kbit ; - L'envoi de paquets audio par RTSP (Real Time Streaming Protocol). Selon un mode de réalisation, l'utilisation de la librairie live555 permet l'encapsulation des flux mp3 destinés à un client selon le protocole RTSP.
Une procédure 204 permet le contrôle des flux audio par l'utilisateur à partir d'un terminal multimédia fixe ou de préférence portable, 104. Ledit terminal portable peut être un lecteur mp3, un téléphone intelligent, une tablette ou un PC. L'application cliente permettant ce contrôle peut être téléchargée à partir d'un serveur distant. Elle comprend au moins réalisation les fonctions suivantes : - Interface graphique simple et intuitive permettant d'accéder au serveur à distance ; - Envoi au serveur de messages OSC de contrôle des flux audio du serveur du type défini ci-dessus. Par exemple, une application OSC Control (http://charlieroberts.com/Control/) permet de définir rapidement des interfaces pour envoyer des messages OSC. Tout autre outil de définition des interfaces peut cependant être utilisé sans sortir du cadre de l'invention.
Une procédure 205 gère les communications entre le client 104 et le serveur 101. - Routage des paquets OSC du client vers le serveur. - Échange de paquets RTSP entre client et serveur.
Pour faire communiquer le client et serveur, il est utile de vérifier que les éléments du réseau ne bloquent aucun message. L'élément bloquant peut être le routeur qui doit diriger les flux venant d'internet vers les machines connectées à un réseau local de production des flux. Ce routeur doit donc être configuré pour rediriger les messages OSC venant du client 104 vers le 3 0 1 1 3 7 3 10 serveur 101. Les communications RTSP doivent également être traitées pour que le serveur reçoive les informations. Une architecture matérielle et logicielle permettant de mettre en oeuvre 5 l'invention peut par exemple être constituée par : - Un serveur sur une plateforme Ubuntu 64 bits 12.04 ; - Des clients sous Android ou iOS : le lecteur peut par exemple être un BSPlayer pour Android ou un OVPlayer pour iOS ; une application OSC Control doit également être implantée sur chacune des deux 10 plateformes ; - Programmation en C pour réaliser la librairie 201 et l'encodage/décodage, par exemple de type FFMPEG. - Programmation C++ pour la partie communication OSC et RTSP. - Programmation javascript pour l'application de contrôle de messages 15 OSC implantée sur le terminal. D'autres configurations matérielles ou logicielles peuvent cependant être utilisées sans sortir du cadre de l'invention. En particulier, le serveur peut être constitué de ressources matérielles réparties et organisées en "cluster". 20 La figure 3 représente un organigramme des traitements pour mettre en oeuvre l'invention selon plusieurs de ses modes de réalisation. Dans un mode de réalisation de l'invention, l'utilisateur se connecte sur son terminal au compte de son lecteur audio au cours d'une étape 301. Il accède alors à un compte sur le serveur de l'opérateur au cours d'une étape 302. Il 25 choisit dans un catalogue un contenu audio au cours d'une étape 303. Les contenus peuvent éventuellement être personnalisés et stockés sur un espace privatif sur le serveur pour utilisation personnelle. Au cours d'une étape 304, le profil de l'utilisateur est soit chargé s'il existe déjà sur le serveur, soit généré s'il n'a pas encore été créé ou s'il doit être modifié (par 30 exemple s'il est trop ancien ou si le terminal ou le casque qui est connecté au terminal sont différents des matériels utilisés lors d'une connexion précédente. Plusieurs profils utilisateurs différents pour un même utilisateur peuvent éventuellement être créés et stockés sur le serveur. La création du profil de l'utilisateur peut comprendre des sous-étapes de 35 génération automatique ou semi-automatique d'un modèle de tête dudit utilisateur permettant l'utilisation d'HRTF personnalisées. Les paramètres pris en compte dans le profil peuvent également comprendre une représentation, éventuellement simplifiée, d'un audiogramme de l'utilisateur, ladite représentation étant créée sur le terminal ou entrée en provenance d'un dispositif de stockage. La création d'un modèle de tête peut être effectuée à partir d'une photo de la tête de l'utilisateur prise par l'appareil photo inclus dans le téléphone portable et transmise au serveur. Dans ce cas, des algorithmes de reconnaissance d'images, utilisant éventuellement des étapes d'apprentissage, peuvent être implantés sur le serveur. La création du modèle de tête peut également être effectuée par entrée guidée sur le terminal de paramètres de dimensions caractérisant ladite tête, comme par exemple le périmètre crânien ou bien la taille du pavillon de l'oreille. Le type du terminal et le type du casque utilisés peuvent également être pris en compte, ainsi que des paramètres définissant des types d'écoute : des mesures de réponses impulsionnelles de casque permettent par exemple d'assurer l'effet binaural suivant le choix du casque. En effet, chaque casque agit de façon spécifique sur les informations fréquentielles du son. Les paramètres d'égalisation, déduits des mesures de réponses impulsionnelles adaptée au matériel d'écoute utilisée permettent d'améliorer l'effet de spatialisation lors de l'écoute. Différentes modalités de personnalisation du profil de l'utilisateur peuvent être combinées (capture automatique de certaines données, saisie par l'utilisateur d'autres données, entrée en provenance d'un dispositif de stockage). La personnalisation peut éventuellement être effectuée sur un serveur différent du serveur de mise à disposition des contenus. Elle peut également être effectuée à partir d'un terminal qui n'est pas le terminal d'écoute à partir duquel l'utilisateur se connecte au serveur du diffuseur/distributeur de contenus. Ces différentes variantes ne sortent pas du champ de l'invention.
A partir du profil de l'utilisateur et du choix du contenu audio, les éléments permettant la génération des données nécessaires au traitement binaural sont créées (base de données HRTF, éventuellement couplée avec un modèle de tête, paramètres d'égalisation du casque et de choix d'une acoustique de salle ; messages OSC nécessaires à l'exécution des procédures 201 ...) au cours d'une étape 305.
Une étape classique 306 de validation de l'accès au service est ensuite réalisée. Cette étape peut être un paiement unitaire ou un débit du compte de l'utilisateur enregistré par l'opérateur. Le service peut éventuellement être gratuit pour l'utilisateur et rémunéré par exemple par la publicité.
Les étapes de téléchargement 307 et d'écoute 308 des contenus spatialisés sont alors déclenchées par exemple par les messages OSC, comme décrit ci-dessus. L'utilisateur peut cependant avoir une option d'écoute en mode stéréo.
Les exemples décrits ci-dessus sont donc donnés à titre d'illustration de certains des modes de réalisation de l'invention. Ils ne limitent en aucune manière le champ de l'invention qui est défini par les revendications qui suivent.

Claims (14)

  1. REVENDICATIONS1. Terminal (104) d'écoute de contenus audio comprenant : - Un module d'établissement d'une session de communication avec un serveur (101) ; - Un module de téléchargement de contenus audio sur ledit terminal à partir dudit serveur ; - Un module de reproduction desdits contenus audio par un dispositif d'écoute (105) connecté audit terminal; Ledit terminal d'écoute étant caractérisé en ce que : - le module d'établissement d'une session de communication est configuré pour permettre la sélection par un utilisateur du terminal d'un profil d'écoute audio dudit utilisateur, ledit profil comprenant au moins un paramètre appartenant à un groupe de paramètres comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; et en ce que, - le module de téléchargement est configuré pour télécharger du serveur vers le terminal d'écoute au moins un contenu audio (206) en sortie d'une fonction de traitement de signal audio (201) paramétrée par le profil d'écoute audio de l'utilisateur.
  2. 2. Module de personnalisation d'écoute comprenant : - Un sous-module de capture de paramètres constituant un profil d'écoute audio d'un utilisateur (103), lesdits paramètres étant choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute (105) et des paramètres caractérisant un lieu d'écoute, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; - Un sous-module de transmission dudit profil d'écoute à un serveur (101) ;ledit module de personnalisation d'écoute étant caractérisé en ce que ledit sous-module de transmission est configuré pour générer, à partir dudit profil d'écoute, un message interprétable par ledit serveur pour commander l'exécution par un module de traitement audio (201) d'au moins une fonction de traitement de signal audio d'au moins un contenu audio (206) accessible par ledit serveur, ladite fonction de traitement de signal audio étant paramétrée par le profil d'écoute de l'utilisateur.
  3. 3. Terminal d'écoute selon la revendication 1, caractérisé en ce que ladite au moins une fonction de traitement de signal audio est une fonction de spatialisation binaurale d'au moins un contenu audio.
  4. 4. Terminal d'écoute selon la revendication 1, caractérisé en ce que ladite au moins une fonction de traitement de signal audio est une fonction d'adaptation à une acoustique tri-dimensionnelle d'un lieu d'écoute.
  5. 5. Terminal d'écoute selon la revendication 1, comprenant en outre un module de personnalisation selon la revendication 2.
  6. 6. Module de personnalisation selon la revendication 2, comprenant en outre un sous-module de prise de vues de la tête de l'utilisateur, lesdites vues étant choisies pour permettre une détermination de paramètres significatifs du profil d'écoute au casque dudit utilisateur.
  7. 7. Module de personnalisation selon la revendication 2, comprenant en outre un sous-module de capture d'un audiogramme de l'utilisateur.
  8. 8. Serveur (101) de contenus audio comprenant : Un module d'acquisition de profils d'écoute audio d'utilisateurs, lesdits profils comprenant, pour chaque utilisateur, des paramètres choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute (105) etdes paramètres caractérisant un lieu d'écoute simulé, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur ; - Un module d'établissement de sessions de communication par lesdits utilisateurs ; - Un module de traitement audio ; - Un module de téléchargement de contenus audio par lesdits utilisateurs vers le dispositif d'écoute ; Ledit serveur de contenus étant caractérisé en ce que : - Le module d'établissement de sessions de communication est configuré pour permettre à un utilisateur d'exécuter une fonction d'activation d'un profil d'écoute audio choisie dans un groupe comprenant une transmission, une sélection et une validation dudit profil d'écoute audio; et en ce que, - Le module de traitement audio est configuré pour exécuter au moins une fonction de traitement de signal audio paramétrée par la sortie de la fonction d'activation du profil audio ; et en ce que, - Le module de téléchargement de contenus audio est configuré pour fournir à l'utilisateur un contenu audio en sortie de ladite au moins une fonction de traitement de signal audio paramétrée.
  9. 9. Serveur de contenus audio selon la revendication 8, caractérisé en ce que ladite au moins une fonction de traitement de signal audio fait appel à des fonctions HRTF.
  10. 10.Serveur de contenus audio selon la revendication 9, caractérisé en ce que les fonctions HRTF auxquelles ladite fonction de traitement de signal audio fait appel dépendent du profil d'écoute audio de l'utilisateur.
  11. 11.Serveur de contenus audio selon la revendication 10, caractérisé en ce que les fonctions HRTF sont calculées aux points de provenance des sons spatialisés par interpolation des résidus des mesures après soustraction des valeurs en ces points du modèle de mesure correspondant au profil d'écoute audio de l'utilisateur.35
  12. 12. Protocole de transmission d'un message comprenant des paramètres caractérisant un profil d'écoute audio d'un utilisateur d'un dispositif d'écoute de contenus audio, ledit protocole étant caractérisé en ce que lesdits paramètres sont choisis dans un groupe comprenant au moins des paramètres morphologiques et des paramètres fonctionnels caractérisant ledit utilisateur, des paramètres caractérisant un dispositif d'écoute et des paramètres caractérisant un lieu d'écoute simulé, lesdits dispositifs et lieu d'écoute étant associés audit utilisateur .
  13. 13. Protocole de transmission selon la revendication 12, caractérisé en ce que ledit message est transmis à un module de traitement audio résidant sur un serveur pour déclencher l'exécution d'au moins une fonction de traitement de signal audio paramétrée par le profil d'écoute audio de l'utilisateur.
  14. 14. Protocole de transmission selon la revendication 13, caractérisé en ce que ledit déclenchement est commandé par l'utilisateur à partir d'un terminal d'écoute audio, ledit terminal exécutant ensuite une procédure de téléchargement d'au moins un contenu audio en sortie de la au moins une fonction de traitement de signal audio.
FR1359368A 2013-09-27 2013-09-27 Terminal portable d'ecoute haute-fidelite personnalisee Pending FR3011373A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1359368A FR3011373A1 (fr) 2013-09-27 2013-09-27 Terminal portable d'ecoute haute-fidelite personnalisee

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1359368A FR3011373A1 (fr) 2013-09-27 2013-09-27 Terminal portable d'ecoute haute-fidelite personnalisee

Publications (1)

Publication Number Publication Date
FR3011373A1 true FR3011373A1 (fr) 2015-04-03

Family

ID=50624644

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1359368A Pending FR3011373A1 (fr) 2013-09-27 2013-09-27 Terminal portable d'ecoute haute-fidelite personnalisee

Country Status (1)

Country Link
FR (1) FR3011373A1 (fr)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3049802A1 (fr) * 2016-04-05 2017-10-06 Pierre Vincent Procede de diffusion sonore prenant en compte les particularites individuelles
FR3052623A1 (fr) * 2016-06-14 2017-12-15 Benjamin Banoun Systeme d'ecoute.
US10839545B2 (en) 2016-03-15 2020-11-17 Ownsurround Oy Arrangement for producing head related transfer function filters
US10937142B2 (en) 2018-03-29 2021-03-02 Ownsurround Oy Arrangement for generating head related transfer function filters
US11026039B2 (en) 2018-08-13 2021-06-01 Ownsurround Oy Arrangement for distributing head related transfer function filters

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2851878A1 (fr) * 2003-02-28 2004-09-03 France Telecom Procede et systeme d'obtention automatisee de fonctions de transfert acoustiques associees a la morphologie d'un individu
US20060045294A1 (en) * 2004-09-01 2006-03-02 Smyth Stephen M Personalized headphone virtualization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2851878A1 (fr) * 2003-02-28 2004-09-03 France Telecom Procede et systeme d'obtention automatisee de fonctions de transfert acoustiques associees a la morphologie d'un individu
US20060045294A1 (en) * 2004-09-01 2006-03-02 Smyth Stephen M Personalized headphone virtualization

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10839545B2 (en) 2016-03-15 2020-11-17 Ownsurround Oy Arrangement for producing head related transfer function filters
US11823472B2 (en) 2016-03-15 2023-11-21 Apple Inc. Arrangement for producing head related transfer function filters
FR3049802A1 (fr) * 2016-04-05 2017-10-06 Pierre Vincent Procede de diffusion sonore prenant en compte les particularites individuelles
WO2017191384A1 (fr) * 2016-04-05 2017-11-09 Pierre Vincent Procédé de diffusion sonore prenant en compte les particularités individuelles
FR3052623A1 (fr) * 2016-06-14 2017-12-15 Benjamin Banoun Systeme d'ecoute.
WO2017216474A1 (fr) * 2016-06-14 2017-12-21 Banoun Benjamin Systeme d'ecoute
US10937142B2 (en) 2018-03-29 2021-03-02 Ownsurround Oy Arrangement for generating head related transfer function filters
US11026039B2 (en) 2018-08-13 2021-06-01 Ownsurround Oy Arrangement for distributing head related transfer function filters

Similar Documents

Publication Publication Date Title
US11790096B2 (en) Tokenizing digital assets with restrictions on a blockchain
FR3011373A1 (fr) Terminal portable d'ecoute haute-fidelite personnalisee
CN105027580A (zh) 用于输出修改的音频信号的方法以及通过应用程序产生的图形用户界面
EP1563485A1 (fr) Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US12047763B2 (en) Method to expedite playing of binaural sound to a listener
WO2007101958A2 (fr) Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
WO2011045506A1 (fr) Traitement de donnees sonores encodees dans un domaine de sous-bandes
EP2920979B1 (fr) Acquisition de données sonores spatialisées
EP3475943A1 (fr) Procede de conversion, d'encodage stereophonique, de decodage et de transcodage d'un signal audio tridimensionnel
CN107301028B (zh) 一种基于多人远程通话的音频数据处理方法及装置
US20240048928A1 (en) Method that Expedites Playing Sound of a Talking Emoji
EP3603076B1 (fr) Procédé de sélection d'au moins une partie d'image à télécharger par anticipation pour restituer un flux audiovisuel
US11190896B1 (en) System and method of determining head-related transfer function parameter based on in-situ binaural recordings
EP3729832B1 (fr) Traitement d'un signal monophonique dans un décodeur audio 3d restituant un contenu binaural
US20210076154A1 (en) Playing Binaural Sound Clips During an Electronic Communication
US10856097B2 (en) Generating personalized end user head-related transfer function (HRTV) using panoramic images of ear
FR3065137A1 (fr) Procede de spatialisation sonore
EP3484185B1 (fr) Modelisation d'ensemble de fonctions de transferts acoustiques propre a un individu, carte son tridimensionnel et systeme de reproduction sonore tridimensionnelle
FR3040253B1 (fr) Procede de mesure de filtres phrtf d'un auditeur, cabine pour la mise en oeuvre du procede, et procedes permettant d'aboutir a la restitution d'une bande sonore multicanal personnalisee
WO2015101534A1 (fr) Systeme d'optimisation d'ecoute musicale
FR3096476A1 (fr) Procédé de réglage d’un dispositif de restitution basé sur la position d’un utilisateur
WO2009081002A1 (fr) Traitement d'un flux audio 3d en fonction d'un niveau de presence de composantes spatiales