EP4348460A1

EP4348460A1 - Procédé et dispositif de caractérisation d'un utilisateur, et dispositif de fourniture de services l'utilisant

Info

Publication number: EP4348460A1
Application number: EP22732606.3A
Authority: EP
Inventors: Christian Gregoire; Julian MOREIRA; Nicolas PELLEN
Original assignee: Orange SA
Current assignee: Orange SA
Priority date: 2021-05-31
Filing date: 2022-05-30
Publication date: 2024-04-10
Also published as: WO2022254136A1; US20240256641A1; FR3123467A1

Abstract

L'invention relève du domaine de la sécurité informatique. Pour cela, l'invention concerne un procédé et un dispositif de caractérisation d'un utilisateur, notamment d'un utilisateur d'un dispositif et/ou d'un service. Un objet de l'invention est un procédé de caractérisation d'un utilisateur, le procédé de caractérisation comportant une comparaison de premières données associées à un premier objet sonore spatialisé en une première localisation par une interface utilisateur d'un terminal de communication et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les deuxièmes données étant fonction d'un deuxième objet sonore spatialisé perçu en une deuxième localisation la comparaison déclenchant en cas de résultat positif une caractérisation de la source d'interaction comme étant un utilisateur approprié,. Ainsi, les erreurs de caractérisation d'un utilisateur comme utilisateur approprié, notamment un utilisateur humain, sont réduites car les systèmes de reconnaissances sonores et vocaux existants n'étant pas aptes sélectionner un son dans un environnement sonore spatialisé, c'est-à-dire une scène audio en trois dimensions 3D.

Description

DESCRIPTION

PROCEDE ET DISPOSITIF DE CARACTERISATION D’UN UTILISATEUR, ET DISPOSITIF DE FOURNITURE DE

SERVICES L’UTILISANT

Domaine technique

L'invention relève du domaine de la sécurité informatique. Pour cela, l’invention concerne un procédé et un dispositif de caractérisation d’un utilisateur, notamment d’un utilisateur d’un dispositif et/ou d’un service. L’invention concerne en particulier la caractérisation d’un utilisateur comme étant un utilisateur humain par opposition à un utilisateur informatique ou utilisateur-robot.

État de la technique

Actuellement, la caractérisation d’un utilisateur permet de différence l’utilisateur humain de l’utilisateur-robot (c’est-à-dire notamment un utilisateur informatique mis en œuvre par un ordinateur). Cette caractérisation utilise un test dit CAPTCHA pour « Completely Automated Public Turing test to tell Computers and Humans Apart » en anglais, c’est-à-dire test public de Turing complètement automatisé pour différencier les ordinateurs et les humains, ou un test HIP pour « Human Interaction Proof » en anglais, c’est-à-dire test de preuve d’interaction humaine.

L’utilisation de test CAPTCHA permet de prémunir un serveur recevant des formulaires informatiques non seulement de la réception de formulaires indésirables ou spam car provenant d’utilisateur-robot, mais aussi d’attaque en déni de services, c’est-à-dire de la mise en œuvre par le serveur d’un grand nombre de traitements inutiles liés aux formulaires indésirables reçus. En outre, l’utilisateur de test CAPTCHA permet de réduire les surcharges de réseaux liés aux attaques par déni de services d’un ou plusieurs serveurs en évitant de télécharger des documents requis par un ou plusieurs utilisateurs-robots.

Il existe différents types de test CAPTCHA. Les plus courants sont les CAPTCHA dits visuels dans lesquels l’utilisateur saisit, sur demande, une série de lettres correspondant aux lettres déformées affichées à l’écran ou clique, sur demande, dans une mosaïque d’images affichées sur les images de la mosaïque comportant un objet particulier, par exemple des feux tricolores.

Mais, pour certains utilisateurs, la présence d’un CAPTCHA pour accéder à un site ou à un contenu est tout simplement rédhibitoire. Par exemple, un utilisateur non-voyant ne peut pas renseigner un CAPTCHA visuel. En outre, ces systèmes de vérification échouent à reconnaître certains utilisateurs handicapés comme humains et rendent donc impossible, pour ces utilisateurs, de créer des comptes, d’écrire des commentaires ou d’effectuer des achats sur certains sites. Pour remédier à ces problèmes d’accessibilité, un CAPTCHA sonore peut être utilisé proposant soit que l’utilisateur identifie, sur demande, un objet sonore diffusé ou saisit, sur demande, une série de chiffres correspondant aux chiffres énoncés vocalement lors de la diffusion d’un extrait sonore. Mais, les systèmes de reconnaissances actuels, reconnaissance d’image et reconnaissance vocale, ont fortement progressé et sont disponibles de manière simple et à un grand nombre de personnes. Ces CAPTCHAs sont donc faciles à contourner par des robots correctement programmés pour faire appel à ces techniques de reconnaissance d’image et de voix.

Pour limiter le contournement de ces CAPTCHAs, des systèmes de CAPTCHA utilisent, dans un premier temps, la 3D visuelle. Par exemple, le texte affiché à saisir par l’utilisateur est déformé en trois dimensions pour déformer d’avantage les lettres à reconnaître. D’autres systèmes de CAPTCHA sonore, diffuse, dans un deuxième temps, l’extrait sonore à identifier (notamment des paroles) dans un fond sonore, par exemple de type effet cocktail. Mais les techniques de reconnaissances s’améliorant rapidement, les dernières générations de système de reconnaissance d’image et vocale sont de plus en plus robustes à ce genre de perturbations.

Exposé de l’invention

Un des buts de la présente invention est de remédier à des inconvénients/insuffisances de l'état de la technique/ d'apporter des améliorations par rapport à l'état de la technique.

Un objet de l’invention est un procédé de caractérisation d’un utilisateur, le procédé de caractérisation comportant une comparaison de premières données associées à un premier objet sonore spatialisé en une première localisation par une interface utilisateur d’un terminal de communication et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation la comparaison déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié,.

Ainsi, seul un utilisateur approprié, notamment un utilisateur humain, étant apte à fournir des deuxièmes données correspondant aux premières données car seul apte à donner la localisation d’un objet sonore spatialisé donné ou une caractéristique d’un objet sonore spatialisé diffusé à une localisation donnée voire la réponse à une question vocale diffusée à une localisation donnée. En effet, les systèmes de reconnaissances sonores et vocaux existants n’étant pas aptes sélectionner un son dans un environnement sonore spatialisé, c’est-à-dire une scène audio en trois dimensions 3D.

Avantageusement, les premières données et les deuxièmes données sont une parmi les types de données suivantes :

+ un paramètre de localisation d’un objet sonore spatialisé ;

+ une catégorie de source génératrice d’un objet sonore ;

+ une réponse à une question vocalisée dans un objet sonore ; Ainsi, l’invention réduit les erreurs de caractérisation d’un utilisateur comme un utilisateur humain un utilisateur robot utilisant un système de reconnaissance sonore car ces systèmes ne sont aptes :

- ni à déterminer la localisation d’un objet sonore donné. Les erreurs de caractérisation de l’utilisateur sont réduites.

- ni, encore moins, à effectuer leur traitement sur un objet sonore diffusé à une localisation donnée dans un environnement sonore capté et traité par ces systèmes de reconnaissance pour déterminer la catégorie de source d’objet sonore, Par conséquent, les erreurs de caractérisation de l’utilisateur sont encore plus limitées.

- ni, encore moins, pour répondre à une question posée par l’objet sonore. En effet, cela nécessite non seulement la reconnaissance vocale d’un objet sonore diffusé de manière spatialisé en une localisation donnée dans un environnement sonore spatialisé mais aussi une recherche d’une réponse à la question reconnue par la reconnaissance vocale. Donc, les erreurs de reconnaissance liées à la difficulté par la reconnaissance vocale d’extraire de l’environnement sonore spatialisé l’objet sonore diffusé engendrent des erreurs de réponse car la question reconnue traitée par le moteur de recherche sera erronée. Par conséquent, les erreurs de caractérisation de l’utilisateur deviennent alors infimes.

Avantageusement, le procédé de caractérisation comporte une reproduction d’une requête d’interaction au premier objet sonore spatialisé, la requête d’interaction étant destinée à l’utilisateur, les deuxièmes données sont des données reçues suite à la reproduction de ladite requête d’interaction.

Avantageusement, la requête d’interaction comporte le type de deuxièmes données attendues lors de l’interaction.

Avantageusement, la requête d’interaction comporte en outre la deuxième localisation du deuxième objet sonore spatialisé, la deuxième localisation correspondant à la première localisation.

Ainsi, la localisation de l’objet sonore que l’utilisateur doit écouter pour le caractériser peut varier d’une caractérisation à une autre, réduisant les risques d’apprentissage de la localisation par des systèmes informatiques et donc les risques d’erreurs de caractérisation.

Avantageusement, le procédé de caractérisation d’un utilisateur caractérise l’utilisateur d’au moins un des éléments suivants :

+ un service mis en œuvre par un dispositif de fourniture de service ;

+ d’un dispositif parmi les dispositifs suivants :

- le terminal de communication ;

- un dispositif de traitement local ou réseau ;

- un dispositif de fourniture de services ; - un équipement d’un réseau de communication auquel est connecté un terminal de communication de l’utilisateur.

Avantageusement, le procédé de caractérisation comporte un contrôle mis en oeuvre par l’interface utilisateur, le contrôle contrôlant l’interface utilisateur au moyen d’une commande de reproduction spatialisée comportant le premier objet sonore et la première localisation.

Avantageusement, le contrôle déclenche une activation d’une capture de deuxièmes données par l’interface utilisateur, les données captées comportant les deuxièmes données reçues.

Avantageusement, selon une implémentation de l'invention, les différentes étapes du procédé selon l'invention sont mises en œuvre par un logiciel ou programme d'ordinateur, ce logiciel comprenant des instructions logicielles destinées à être exécutées par un processeur de données d'un dispositif faisant partie d’un dispositif de caractérisation et/ou d’un dispositif de fourniture de services et étant conçus pour commander l'exécution des différentes étapes de ce procédé.

L'invention vise donc aussi un programme comprenant des instructions de code de programme pour l’exécution des étapes du procédé de selon l’une quelconque des revendications précédentes lorsque ledit programme est exécuté par un processeur.

Ce programme peut utiliser n'importe quel langage de programmation et être sous la forme de code source, code objet ou code intermédiaire entre code source et code objet tel que dans une forme partiellement compilée ou dans n'importe quelle autre forme souhaitable.

Un objet de l’invention est également un dispositif de caractérisation d’un utilisateur, le dispositif de caractérisation comportant un comparateur de premières données associées à un premier objet sonore spatialisé en une première localisation par une interface utilisateur d’un terminal de communication et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation, le comparateur déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié.

Un objet de l’invention est aussi un dispositif de fourniture de services, le dispositif de fourniture de service comportant :

+ un processeur apte à mettre en œuvre au moins un service ;

+ une interface d’échange avec un terminal de communication ; et

+ un dispositif de caractérisation d’un utilisateur du service comportant un comparateur de premières données associées à un premier objet sonore spatialisé en une première localisation par une interface utilisateur du terminal de communication de l’utilisateur et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation, le comparateur déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié et commandant au processeur la mise en oeuvre du service.

Brève description des dessins

Les caractéristiques et avantages de l’invention apparaîtront plus clairement à la lecture de la description, faite à titre d'exemple, et des figures s’y rapportant qui représentent :

Figure 1 , un schéma simplifié d’un procédé de caractérisation de l’utilisateur selon l’invention,

Figure 2, un schéma simplifié d’une scène audio 3D utilisée par l’invention,

Figure 3a, un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une position d’un objet sonore,

Figure 3b, un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une position d’un objet sonore,

Figure 4a, un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une catégorie d’un objet sonore,

Figure 4b, un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une catégorie d’un objet sonore,

Figure 5a, un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’un objet sonore comportant une requête d’interaction,

Figure 5b, un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’un objet sonore comportant une requête d’interaction,

Figure 6, un schéma simplifié d’une architecture de communication comportant un dispositif de caractérisation selon l’invention.

Description des modes de réalisation

Dans le contexte de la diffusion spatialisée de son ou son 3D, c’est-à-dire de la reproduction en 3D d’une scène audio, les différents objets virtuels de la scène audio émetteurs d’un signal sonore ou son constituent un objet sonore. La spatialisation de ces objets sonores en une localisation donnée permet à l’auditeur de percevoir ces objets sonores comme s’ils émettaient à partir de cette localisation dans l’environnement en trois dimensions entourant l’auditeur. Pour cela, l’invention utilise les techniques connues de spatialisation du son, notamment des techniques de synthèse binaurale ou techniques utilisant des fonctions de transfert acoustiques ou filtres binauraux (HRTF ou Head Related Transfer Function en anglais). L’avantage de l’utilisation des filtres binauraux et d’un casque mettant en oeuvre de tels filtres est qu’il est peu coûteux à mettre en oeuvre et donc utilisable par un grand nombre de personnes ce qui est notamment particulièrement adapté à la caractérisation de l’utilisateur. L’invention peut aussi utilisé d’autres techniques de spatialisation de son notamment sur enceintes comme les techniques transaurale, WSF, Ambisonoic, 5.1, etc. La figure 1 illustre un schéma simplifié d’un procédé de caractérisation de l’utilisateur selon l’invention.

Le procédé de caractérisation HCP comporte une comparaison CMP de premières données d1 associées à un premier objet sonore OSi spatialisé en une première localisation pos_osi d’une scène audio spatialisée ES par une interface utilisateur d’un terminal de communication et de deuxièmes données d2 reçues suite à la reproduction 3D_RPR du premier objet sonore OSi spatialisé. Les premières données d1 sont distinctes du premier objet sonore OS1. Les deuxièmes données d2 sont fonction d’un deuxième objet sonore OSP2 spatialisé perçu en une deuxième localisation pososp2 de la scène audio spatialisée 3DES. La comparaison CMP déclenche, en cas de résultat positif [Y], une caractérisation de la source d’interaction comme étant un utilisateur approprié cru=h.

En particulier, les premières données d1 et les deuxièmes données d2 sont une parmi les types de données suivantes :

+ un paramètre de localisation pos_os d’un objet sonore spatialisé OS;

+ une catégorie ty_os de source génératrice d’un objet sonore OS;

+ un instant t_os ou un ordre de reproduction de l’objet sonore OS dans un environnement sonore constitué d’une série d’objets sonores ;

+ une réponse à une question vocalisée dans un objet sonore OS.

Par catégorie de source génératrice peuvent être entendu des classes de catégorie : machine, animaux, machines, naturelles, etc. et/ou des sous-classes : pour les machines, véhicules, électroménager, machine industrielle, etc. ; pour les animaux, chien, chat, vache, serpent, baleine, etc. ; pour naturelle, pluie, vent, orage, etc. et/ou des sous-sous-classes : voiture, avion, train...

En particulier, le procédé de caractérisation HCP comporte une reproduction IRQ_RPR d’une requête d’interaction irq au premier objet sonore spatialisé OSi. La requête d’interaction irq est destinée à l’utilisateur UH, UR. Les deuxièmes données d2 sont des données reçues dr suite à la reproduction de ladite requête d’interaction IRQ_RPR.

En particulier, la requête d’interaction irq comporte le type ty² _0S de deuxièmes données d2 attendues lors de l’interaction a.

En particulier, la requête d’interaction irq comporte en outre la deuxième localisation pos² _os du deuxième objet sonore spatialisé OS². Dans ce cas, la deuxième localisation pos² _os correspond à la première localisation pos¹ _os : pos² ₀s = pos¹ ₀s.

En particulier, le procédé de caractérisation HCP d’un utilisateur caractérise l’utilisateur d’au moins un des éléments suivants :

+ un service mis en œuvre par un dispositif de fourniture de service ; + d’un dispositif parmi les dispositifs suivants :

- le terminal de communication ;

- un dispositif de traitement local ou réseau ;

- un dispositif de fourniture de services ;

- un équipement d’un réseau de communication auquel est connecté un terminal de communication de l’utilisateur.

En particulier, le procédé de caractérisation HCP comporte un contrôle CNT mis en oeuvre par l’interface utilisateur. Le contrôle CNT contrôle l’interface utilisateur au moyen d’une commande de reproduction spatialisée rpr_cmd comportant le premier objet sonore OS1 et la première localisation pos¹os.

En particulier, le contrôle CNT déclenche d2_trg une activation d’une capture CPT de données par l’interface utilisateur. Les données captées de comportant les deuxièmes données reçues d2.

En particulier, le procédé de caractérisation HCP comporte une sélection d’un environnement sonore ES_SLCT dans un dispositif de stockage BOS, tel qu’une mémoire ou une base de données, comportant un ou plusieurs environnements sonores prédéfinis. En particulier, la base de données, est une base de sons ou une base d’objets sonores voire une base d’environnements sonores. Un environnement sonore es prédéfini mémorisé comporte un ou plusieurs objets sonores os¹, {os¹i}i. Eventuellement, un objet sonore os¹, {os¹i}i est associé à un ou plusieurs paramètres caractéristiques parmi les suivants :

- une localisation prédéfinie pos¹ ₀s, {pos¹ _OSi}i,

- une catégorie de sources sonores ty¹ ₀s, {ty¹ _0Si}i,

- un instant {t¹ _0Si}i ou un ordre de reproduction de l’objet sonore OS dans un environnement sonore constitué d’une série d’objets sonores {OS¹Î}Î;

- une réponse r¹ _os à une question vocalisée incluse dans l’objet sonore, la réponse r¹ _os constituant les premières données d1 ,

- etc.

Ainsi, la sélection d’environnement sonore ES_SLCT reçoit du dispositif de stockage BOS un environnement sonore es composé :

- soit d’un ou plusieurs premiers objets sonores OS1, {OS¹i}i,

- soit d’un ou plusieurs couples formés par :

+ un premier objet sonore et une première localisation (OS¹, pos¹ ₀s), {(OS¹i, pos¹ ₀si)}i, ou + un premier objet sonore et une première catégorie de sources sonores (OS¹, ty¹ ₀s), {(OS¹i,ty¹osi)}i, ou

+ un premier objet sonore et une première réponse à une question vocalisée incluse dans le premier objet sonore (OS¹, r¹ ₀s=d1), {(OS¹i, r¹ _0Si)}i,

+ etc.

- soit un ou plusieurs n-uplets formés par un premier objet sonore et un ou plusieurs des paramètres suivants : une première localisation, une première catégorie de source sonore, une première réponse, etc. (OS¹, pos¹ _os, ty¹ _os), {(OS¹·, posV ty¹ _0Si)}i, (OS¹, pos¹ _os, r¹ _os=d1), {(OS¹·, pos¹ ₀si, r¹ _0Si)}i, (OS¹, ty¹os, r¹os=d1), {(OS¹i, ty¹osi, r¹osi)}i(OS¹, pos¹os, ty¹os, r¹os⁼d1), {(OS¹i, pos¹osi, ty¹osi, r¹osï)}ï, etc. Notamment, la sélection d’environnement sonore ES_SLCT envoie une requête d’environnement sonore es_req à un dispositif de stockage, tel qu’une mémoire ou une base de données BOS. Ainsi, la sélection d’environnement sonore ES_SLCT reçoit l’environnement sonore es en réponse à la requête d’environnement sonore es_req.

En particulier, la sélection d’environnement sonore ES_SLCT sélectionne uniquement un environnement sonore 3D, c’est-à-dire au moins un premier objet sonore associé à une première localisation permettant une reproduction spatialisée du premier objet sonore à la première localisation. Afin de réaliser une sélection uniquement d’environnement sonore 3D, la requête d’environnement sonore comporte un paramètre indicatif de la demande d’environnement sonore 3D et/ou est envoyé uniquement à un dispositif de stockage BOS comportant uniquement des environnements sonores 3D.

De manière alternative, le procédé de caractérisation HCP comporte une vérification 3posl_s ? de la présence de première(s) localisation(s) dans l’environnement sonore reçu es. Ainsi, si l’environnement sonore reçu es ne comporte pas de première localisation :

- soit la vérification 3pos„_s ? déclenche nv_es une nouvelle sélection d’environnement sonore ES_SLCT jusqu’à ce que l’environnement sonore reçu comporte une première localisation d’un premier objet sonore;

- soit le procédé de caractérisation HCP comporte un générateur de localisation POS_GN fournissant à un premier objet sonore de l’environnement sonore, une première localisation générée pos¹m_d- En particulier, le générateur de localisation est un générateur aléatoire de localisation ou un générateur de localisation fonction d’au moins un paramètre de l’objet sonore (par exemple en fonction de la catégorie d’objet sonore, l’objet sonore sera positionné au sol ou plus ou moins haut, etc.).

Ainsi l’environnement sonore sélectionné es sera fournie à la reproduction sonore spatialisée 3D_RPR qui reproduira le premier signal sonore s¹ du premier objet sonore OS¹ comme si l’objet sonore était situé à la première localisation pos¹ _os dans la scène audio spatialisée 3DES.

Afin de créer un environnement sonore en trois dimensions ES propice à la caractérisation d’un utilisateur, le procédé de caractérisation HCP comporte notamment une création 3D_GN d’un environnement sonore tridimensionnel 3DES. La création 3D_GN d’un environnement sonore tridimensionnel comporte notamment la reproduction spatialisé d’un objet sonore 3D_RPR. La reproduction spatialisée d’un objet sonore permet de diffuser un son ou signal sonore s associé à l’objet sonore OS comme s’il était émis à partir d’une localisation posos correspondant à la localisation associée à l’objet sonore OS dans l’environnement sonore tridimensionnel 3DES. En particulier, la création 3D_GN d’un environnement sonore tridimensionnel 3DES comporte, en outre, au moins une parmi les étapes suivantes :

- la sélection d’environnement sonore ES_SLCT ;

- la vérification de présence de première localisation X pos _s ? ;

- la génération de localisation POS_GN.

En particulier, la requête d’interaction irq porte sur un ou plusieurs premiers objets sonores. La figure 1 illustre le cas où la requête d’interaction concerne un premier objet sonore. Soit l’environnement sonore sélectionné es comporte qu’un seul premier objet sonore OS¹, alors la requête d’interaction irq porte sur ce premier objet sonore OS¹. Soit l’environnement sonore sélectionné es ne comporte plusieurs premiers objets sonores {OS¹i}i, le procédé de caractérisation HCP comporte alors une sélection OSi_SLCT d’un objet sonore parmi l’ensemble des premiers objets sonores {OS¹i}i, de l’environnement sonore sélectionné es. La sélection d’objet sonore OSi_SLCT fournit [i=j] alors l’un des premiers objets sonores OS¹j de l’environnement sélectionné es, voire un couple formés par :

+ le premier objet sonore sélectionné et une première localisation (OS¹j, pos¹ ₀sj), ou + le premier objet sonore sélectionné et une première catégorie de sources sonores (OS¹j,ty¹osj), ou

+ le premier objet sonore sélectionné et un premier instant ou numéro d’ordre de reproduction du premier objet sonore sélectionné dans la première série de premiers objets sonores S0¹os constituant l’environnement sélectionné (OS¹j,t¹ _OSj), ou

+ le premier objet sonore sélectionné et une première réponse à une question vocalisée incluse dans le premier objet sonore (OS¹j, r¹ _0Sj),

+ etc.

- soit un ou plusieurs n-uplets formés par le premier objet sonore sélectionné et un ou plusieurs des paramètre suivants : une première localisation, une première catégorie de source sonore, un premier instant de reproduction, une première réponse, etc. (OS¹j, pos¹ ₀sj, ty¹ ₀sj), (OS¹j, pos¹ ₀sj, r¹ _0Sj), (OS¹j, ty¹osj, r¹osj), (OS¹j, pos¹osj, ty¹osj, r¹osj), etc.

En particulier, le procédé de caractérisation HCP comporte une vérification du nombre d’objets sonores de l’environnement sonore sélectionné i = 1 ?. Si la vérification du nombre d’objets sonores i = 1 ? dénombre plus d’un objet sonore dans l’environnement sonore sélectionné es [N], alors la vérification du nombre d’objets sonores i = 1 ? déclenche la sélection OSi_SLCT d’un objet sonore dans l’environnement sonore sélectionné es.

En particulier, le procédé de caractérisation HCP comporte une génération IRQ_GN d’une requête d’interaction irq concernant un premier objet sonore : seul objet sonore OS¹ ou objet sonore sélectionné OS¹jde l’environnement sonore sélectionné es. La requête d’interaction irq porte sur un ou plusieurs paramètres caractéristiques du premier objet sonore OS¹, OS¹j. En particulier, le procédé de caractérisation HCP comporte une génération d’une requête d’interaction relative à la localisation du premier objet POSRQ_GN. Si l’environnement sonore reproduit es ne comporte qu’un seul objet sonore, la requête d’interaction peut être simplement relative à la position du son perçu. Mais, si l’environnement sonore reproduit es comporte plusieurs objet sonores, la requête d’interaction irq peut comporter un paramètre caractéristique du premier objet sonore sélectionné OS¹j pour lequel la requête d’interaction irq requiert une interaction relative à la position du son perçu pour ce premier objet sélectionné. Par exemple, la requête d’interaction irq indiquera la catégorie ty¹ _0Sj de source sonore à positionner dans l’environnement sonore reproduit spatialement.

En particulier, le procédé de caractérisation HCP comporte une génération d’une requête d’interaction relative à la catégorie du premier objet sonore TYRQ_GN. La génération de requête relative à la catégorie TYRQ_GN est utilisée dans le cas d’un environnement sonore es comportant plusieurs premiers objets sonores, la requête d’interaction irq comporte la première localisation associé au premier objet sonore sélectionné OS¹j et est relative à la catégorie de la source émettrice du son perçu. Par exemple, la requête d’interaction irq indiquera la localisation pos¹ _OSj du premier objet sonore reproduit spatialement pour lequel l’utilisateur doit identifier la catégorie de source sonore.

En particulier, le procédé de caractérisation HCP comporte une génération d’une requête d’interaction relative à la question vocalisée dans le premier objet sonore DRQ_GN. La génération de requête relative à une question vocalisée DRQ_GN est utilisée dans le cas d’un environnement sonore es comportant plusieurs premiers objets sonores, la requête d’interaction irq comporte la première localisation associé au premier objet sonore sélectionné OS¹j et est relative à la question vocalisée dans le son perçu. Par exemple, la requête d’interaction irq indiquera la localisation pos¹ _OSj du premier objet sonore reproduit spatialement, premier objet sonore comportant une question vocalisée à laquelle l’utilisateur doit fournir une réponse.

En particulier, le procédé de caractérisation HCP comporte au moins une vérification de présence d’au moins un paramètre caractéristique associé au premier objet sonore sélectionné OSV notamment, une vérification de présence d’une réponse à une question vocalisée dans le premier objet sonore sélectionné r _sj ?, une vérification de présence d’une catégorie du premier objet sélectionné X tyl_sj ?, etc. Si la présence d’un paramètre caractéristique est vérifié [Y], respectivement 3r£_sj ?, 3tyl_sj ?, alors la génération d’une requête d’interaction relative à ce paramètre caractéristique est mise en oeuvre, respectivement DRQ_GN, TYRQ_GN.

En particulier, le procédé de caractérisation HCP comporte une vérification 3SO _s = {(OSf = ^de présence d’une série de premiers objets sonores dans l’environnement sonore sélectionné (non illustré). Si la vérification de présence d’au moins une série 3S0_gS = {( OS} = 05¹(tosi)_» ^tosi))i ? détecte une première série de premiers objets sonores [Y], alors elle déclenche une génération d’une requête relative à la première série de premiers objets sonores SORQ_GN (non illustrée). Eventuellement, notamment si l’environnement sonore comporte plusieurs premières séries de premiers objets sonores, un résultat positif [Y] de la vérification de présence d’au moins une première série X SO _s = {( OS = 05¹(to_Si), ί^)}; ? déclenche une sélection d’une première série de premiers objets sonores dans l’environnement sonore SO_SLCT (non illustrée) préalablement à la génération SORQ_GN d’une requête relative à la première série de premiers objets sonores sélectionnée. Les séries d’objets sonores sont toujours composées d’objets sonores dont le signal sonore est diffusé/émis l’un après l’autre, c’est-à-dire successivement, espacé ou non de silence. Dans une série d’objets sonores, les objets sonores peuvent avoir un paramètre caractéristique dont la valeur est commune à tous les objets sonores de la série. Par exemple, une série d’objets sonores de mêmes catégorie de sources, une série d’objets sonores dont tous les objets sonores ont une localisation identique, etc.

En particulier, si plusieurs paramètres caractéristiques sont présents, alors :

- soit le procédé de caractérisation HCP comporte plusieurs générations de requêtes spécifiques : par exemple une génération de requête relative à une réponse DRQ_GN et une génération de requête relative à une catégorie de source TYRQ_GN. Par exemple, la question peut être posée par différente catégorie de personnes : homme, femme, enfants, différents accents, etc. Ainsi, la requête d’interaction générée irq comporte les requêtes d’interaction spécifiques fournies par chacune des générations de requêtes spécifiques;

- soit le procédé de caractérisation HCP comporte une sélection de requête RNDRQ sélectionnant une parmi les générations de requêtes spécifiques disponibles: par exemple une génération de requête relative à une réponse DRQ_GN, ou une génération de requête relative à une catégorie de source TYRQ_GN, ou etc. La sélection de requête RNDRQ peut être effectuée de manière aléatoire ou en fonction de la valeur d’un des paramètres caractéristiques ;

- soit le procédé de caractérisation HCP mettra automatiquement en oeuvre la génération d’une requête spécifique prédéfinie par exemple la génération de la requête relative à une réponse DRQ_GN.

Dans un mode de réalisation particulier de l’invention, la sélection d’un premier objet sonore OS¹i_SLCT dans l’environnement sonore ou la sélection d’une série d’objets sonores SO_SLCT est effectuée sur une action de sélection as d’un utilisateur UH, UR. En particulier, l’action de sélection as comporte une valeur d’un paramètre caractéristique du premier objet sonore sélectionné, respectivement de la première série de premiers objets sonores, distinct des valeurs de ce paramètre des autres premiers objets sonores de l’environnement sonore, respectivement des autres premières séries de premiers objets sonores. Par exemple, dans un environnement sonore constitué de cris d’animaux, l’utilisateur indiquera que l’objet sonore a pour catégorie un âne, et le procédé de caractérisation enverra une requête d’interaction sur la localisation de cet âne dans l’environnement sonore spatialisé. En particulier, la génération IRQ_GN d’une requête d’interaction irq comporte une ou plusieurs des étapes suivantes :

- la vérification du nombre d’objets sonore de l’environnement sonore sélectionné i = 1 ?;

- le cas échéant, la sélection d’objet sonore OSi_SLCT dans l’environnement sonore sélectionné ;

- la vérification de présence d’au moins un paramètre caractéristique associé au premier objet sonore sélectionné OS¹j : notamment, la vérification de présence d’une réponse à une question vocalisée dans le premier objet sonore sélectionné 3r„_S7- ?, la vérification de présence d’une catégorie du premier objet sélectionné X tyl_sj ?, etc. ;

- au moins une génération d’une requête d’interaction spécifique, notamment la génération d’une requête d’interaction relative à la localisation du premier objet POSRQ_GN, et/ou la génération d’une requête d’interaction relative à la question vocalisée dans le premier objet sonore DRQ_GN, et/ou une génération de requête relative à une catégorie de source TYRQ_GN, etc.

- la sélection de requête RNDRQ ;

- etc.

La génération de requête d’interaction IRQ_GN et/ou la ou les générations de requêtes spécifiques DRQ_GN, TYRQ_GN, POSRQ_GN, SO_SLCT fournissent une requête d’interaction irq relative à un premier objet sonore, voire à une première série de premiers objets sonores, comportant éventuellement une ou plusieurs requêtes spécifiques relatives à un paramètre caractéristique associé au premier objet sonore, voire à la première série de premiers objets sonores, à une reproduction de requête d’interaction IRQ_RPR. La reproduction de requête d’interaction IRQ_RPR est notamment une reproduction visuelle telle qu’un affichage sur un écran, un casque de réalité virtuel ou augmenté, etc. (la reproduction visuelle étant préalable ou simultanée à la reproduction de l’environnement sonore spatialisée 3D_RPR) et/ou une reproduction sonore préalable à la reproduction de l’environnement sonore spatialisée 3D_RPR.

En particulier, la reproduction de l’environnement sonore spatialisée 3D_RPR est déclenchée par l’une des étapes suivantes : la sélection de l’environnement sonore ES_SLCT, la génération d’une localisation, la génération de requête d’interaction IRQ_GN, la reproduction de requête d’interaction IRQ_RPR.

Suite à la reproduction de la requête d’interaction IRQ_RPR, l’utilisateur UH, UR réagit a en fournissant des deuxièmes données d2 relatives à un deuxième objet sonore OS². Le deuxième objet sonore OS² est l’objet sonore dont le deuxième signal sonore ou deuxième son s² est perçu par l’utilisateur dans l’environnement sonore spatialisé reproduit 3DES qui correspond pour l’utilisateur au premier objet sonore OS1 auquel la requête d’interaction irq reproduite est relative.

Le procédé de caractérisation HCP reçoit de l’utilisateur ces deuxièmes données d2. Notamment, le procédé de caractérisation HCP comporte une ou plusieurs des étapes suivantes : - une capture CPT d’une action a de l’utilisateur fournissant des données captées de;

- une réception de données RCV recevant des données provenant d’une interface utilisateur, notamment des données captées de ou une action a, et fournissant des données reçues dr ;

- une extraction de deuxièmes données XTR de données reçues dr et/ou captées de.

En particulier, la création d’un environnement sonore spatialisé 3D_GN et/ou le contrôle de reproduction CNT et/ou la reproduction de l’environnement sonore 3D_RPR déclenche un traitement d’interaction IRTRT et ou une capture CPT et/ou une réception de données RCV.

En particulier, le procédé de caractérisation HCP comporte un traitement d’interaction IRTRT mettant en œuvre le traitement d’une action de l’utilisateur suite à la reproduction de la requête d’interaction IRQ_RPR fournit à la comparaison les deuxièmes données d2. Le traitement d’interaction IRTRT comporte une ou plusieurs des étapes suivantes :

- une capture CPT d’une action a de l’utilisateur fournissant des données captées de;

En particulier, la comparaison CMP déclenche, en cas de résultat positif [N], une caractérisation de la source d’interaction comme étant un utilisateur non-approprié cru=ia.

Dans un mode de réalisation particulier, le procédé de caractérisation HCP est déclenché par un procédé de fourniture de services non illustré, en particulier préalablement à la fourniture du service. La fourniture du service sera déclenchée par la caractérisation de la source d’interaction comme étant un utilisateur approprié, en particulier un utilisateur humain. Eventuellement, dans le cas d’une caractérisation de la source d’interaction comme étant un utilisateur non-approprié, en particulier un utilisateur robot ou agent informatique, le procédé de caractérisation déclenche l’arrêt STP de la mise en œuvre du procédé de fourniture de services.

Dans un mode de réalisation particulier, le procédé de caractérisation HCP est déclenché par un procédé d’accès à un dispositif tiers (terminal de communication, objet connecté, équipement distant..) non illustré, en particulier préalablement à l’autorisation d’accès au dispositif tiers. L’accès au dispositif sera déclenché par la caractérisation de la source d’interaction comme étant un utilisateur approprié, en particulier un utilisateur humain. Eventuellement, dans le cas d’une caractérisation de la source d’interaction comme étant un utilisateur non-approprié, en particulier un utilisateur robot ou agent informatique, le procédé de caractérisation déclenche l’arrêt STP de la mise en œuvre du procédé d’accès au dispositif tiers. Un mode de réalisation particulier du procédé de caractérisation est un programme comprenant des instructions de code de programme pour l’exécution des étapes du procédé de caractérisation lorsque ledit programme est exécuté par un processeur.

La figure 2 illustre un schéma simplifié d’une scène audio 3D utilisée par l’invention.

L’invention est basée sur les positionnements d’objets sonores dans une scène audio 3D comme éléments à caractériser au niveau de l’interface Homme Machine. L’environnement sonore spatialisée ou scène audio 3D 3DES composé d’objets sonores est reproduit autour d’un utilisateur U à caractériser. Sur la figure 2, l’espace tridimensionnel environnant autour de l’utilisateur U est schématisé par un plan figuré par trois axes centrés sur l’utilisateur U : un axe d’abscisse x, un axe d’ordonné y et un axe d’azimut z. Les objets sonores OSi, OS2. OSj,... sont représentés dans cet espace tridimensionnel. Un objet sonore OS1, OS2. OSj,... est un objet O1, O2. Oj . tel que respectivement une voiture, une personne . un animal - en l’occurrence une vache, ... positionné en une localisation pos_osi, pos_OS2. pos_OSj,... de l’espace (définie notamment par des coordonnées dans cet espace tel que, respectivement, pos₀si=(xi,yi,zi), pos_Os2=(x2,y2,Z2=0) . pososj=(xj=0,yj,zj),...dans notre exemple de la figure 2, et émettant un signal sonore ou son si, S2.

Sj .

Les figures 3a, 3b, 4a, 4b, 5a et 5b illustrent des schémas simplifiés d’une interface utilisateur de différents modes de réalisation de l’invention dans le cas de différents types de requête d’interaction : respectivement, relative à une position de l’objet sonore, relative à une catégorie de l’objet sonore ou à une requête d’interaction incluse dans l’objet sonore.

Le procédé de caractérisation selon l’invention propose donc, pour constituer un captcha, de présenter à l’utilisateur U, notamment dans un casque audio avec la technologie binaurale, des sons spatialisés de natures différentes dans une scène sonore et/ou dans un certain ordre (par exemple à un certain instant de reproduction). Pour répondre, il devra, par exemple, indiquer l’emplacement d’un certain type de son parmi ceux présentés et indiqués à quel positionnement il les entend (gauche, devant, droite, ...), bref repérer un son dans un espace virtuel comme le montre les figures 3a et 3b. Cela peut être aussi de devoir répondre à la question entendue dans l’oreille droite par exemple (avec des questions différentes à droite, à gauche, en haut) comme le montre les figures 5a et 5b. La combinaison de la reconnaissance d’un type de son et de son positionnement étant complexe pour une machine, cela permet de déterminer si le répondant est humain ou non.

La figure 3a illustre un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une position d’un objet sonore.

Le cas le plus simple mis en œuvre par le procédé de caractérisation sera donc un seul premier son émis s¹ depuis une première localisation pos¹ _os (c’est-à-dire un environnement sonore es constitué d’un seul premier objet sonore OS¹). La requête d’interaction irq demandera alors à l’utilisateur U d’indiquer la provenance du signal sonore s¹, c’est-à-dire dans quelle direction l’utilisateur U perçoit un deuxième objet sonore OS² suite à la reproduction spatialisée du premier objet sonore OS¹.

La figure 3a montre une interface utilisateur, en l’occurrence un écran 10 sur lequel est affiché la requête d’interaction irq, par exemple une question relative à la localisation pos_os ? et, éventuellement plusieurs choix de réponses iqcm : fposrp, Iposrp, rposrp positionné sur l’affichage par rapport à une représentation de la position de l’utilisateur urp. Eventuellement, l’interface utilisateur, en l’occurrence l’écran 10 propose une zone d’interaction au niveau des choix affichés permettant à l’utilisateur de sélectionner au moyen d’un stylet, d’une souris ou par interaction tactile avec l’écran 10, l’un des choix de réponses affichés : fposrp, Iposrp, rposrp. Par exemple, l’utilisateur entendant un son à sa droite, sélectionnera la position R, fournissant une deuxième donnée correspondant à une deuxième localisation ayant pour valeur droite, rposrp.

Dans un mode de réalisation particulier, le procédé de caractérisation comporte une détermination de la deuxième donnée à partir d’une position d’une main d’un utilisateur, par exemple sa main droite ou la main tenant une manette d’un casque de réalité virtuelle ou augmenté ou d’une console de jeux. Soit le procédé de caractérisation reçoit la position de la main de la manette, soit le procédé de caractérisation capture la position de la main, notamment au moyen d’une caméra. Ainsi, si l’utilisateur place sa main :

- devant lui, le choix correspond à fposrp dans les propositions de la requête d’interaction,

- à sa droite, le choix correspond à rposrp dans les propositions de la requête d’interaction,

- à sa gauche, le choix correspond à Iposrp dans les propositions de la requête d’interaction.

Eventuellement, l’interface utilisateur comporte une zone d’interaction ios avec le premier objet sonore permettant à l’utilisateur de requérir la répétition de la reproduction spatialisée du premier objet sonore.

Eventuellement, l’interface utilisateur comporte une zone d’interaction islct avec la sélection du premier objet sonore permettant à l’utilisateur de requérir une sélection d’un nouvel environnement sonore et donc d’un nouveau premier objet sonore. Ainsi, si le premier objet sonore pose des difficultés particulières de perception à l’utilisateur, celui-ci peut en changer pour lui permettre d’être caractérisé comme utilisateur approprié et donc d’accéder au dispositif/service utilisant le procédé de caractérisation. Cela réduit donc les fausses caractérisations en utilisateur non-approprié.

Ainsi, la requête d’interaction irq reproduite sur l’écran 10 est par exemple « Où entendez-vous ce son ? ». Soit préalablement à la reproduction de la requête d’interaction, soit simultanément à la reproduction de la requête d’interaction, est reproduit un son auquel le procédé de caractérisation demande à l’utilisateur de réagir au moyen de la requête d’interaction. Eventuellement, sur l’écran 10 est aussi reproduite une zone d’interaction avec le son ios. Cette zone d’interaction avec le son ios comporte notamment un élément d’interaction de lecture. Une action a de l’utilisateur relative à cet élément d’interaction déclenche un contrôle de la reproduction spatialisée du son. Par exemple, l’élément d’interaction est notamment symbolisé par un triangle pointant vers la droite tant que le son n’est pas diffusé et la lecture du son n’est pas terminée, par deux traits larges tant que le son est diffusé, et, en fin de diffusion du son, par un triangle pointant sur un trait vertical à gauche. Ainsi, une action sur le triangle pointant vers la droite déclenche la lecture et reproduction spatialisée du son, une action sur les deux traits larges déclenche une suspension de la reproduction du son permettant de reprendre ultérieurement la reproduction spatialisée du son à partir de l’instant de pause, une actions sur la flèche pointant vers la gauche déclenche une reproduction spatialisée du son depuis le début de celui-ci. La zone d’interaction avec le son ios comporte, notamment une règle de lecture qui consiste en une ligne horizontale se remplissant progressivement en fonction de l'avancement de la reproduction spatialisée du son (la ligne est vide au début de la reproduction sonore et plein à la fin de celle-ci. En particulier, l’utilisateur agissant relativement à un point particulier de cette règle de lecture déclenche la reproduction spatialisée du son à partir de l’instant du signal sonore représenté par ce point de la règle de lecture. La zone d’interaction avec le son ios comporte, par exemple, un ascenseur permettant d’interagir avec le volume sonore de la reproduction spatialisée du son. La zone d’interaction avec le son comporte un ou plusieurs des éléments d’interactions parmi les suivants : un élément d’interaction de lecture, une règle de lecture, un ascenseur de volume.

En particulier, la requête d’interaction comporte des consignes relatives aux dispositifs de reproduction sonore à utiliser. Par exemple, elle demande une « écoute au casque uniquement ». Ainsi, les erreurs de caractérisation liées à une reproduction non spatialisée de l’objet sonore en raison de l’utilisation de dispositif de reproduction sonore non adaptée seront évitées.

Eventuellement, les choix multiples proposées iqcm seront sous forme de texte, tel que « devant » pour le choix fposrp, « droite » pour le choix rposrp et « gauche » pour le choix Iposrp et/ou représenté graphiquement par un dessin symbolique d’un utilisateur urp, et des cases ou cercles sélectionnables, par exemple en les cochant, comme le montre la figure 3a.

En particulier, dans la zone de sélection d’un nouveau premier objet sonore, est reproduite la proposition suivante « Vous ne trouvez pas ? Générer un autre son ».

Eventuellement, un même son ou des sons différents reproduits à des instants distincts, notamment dans un ordre donné, peuvent se déplacer dans la scène audio 3D sur une série de N premières localisations. Cela constitue une série d’objets sonores.

Dans une première implémentation du procédé de caractérisation, à chaque objet sonore de la série, c’est-à-dire à chaque nouvelle position d’un son (le même ou un nouveau son), le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3b et attend l’action de l’utilisateur. Le passage à un nouvelle position du son et/ou à un nouvel objet sonore est alors conditionné à un résultat de comparaison positif, c’est-à-dire au fait que l’utilisateur identifie correctement la position actuelle de l’objet sonore actuel (cela signifie que la deuxième donnée correspondant à la localisation de l’objet sonore perçu, c’est-à-dire du deuxième objet sonore, par l’utilisateur correspond à la première donnée correspondant à la localisation actuelle de l’objet sonore en cours de reproduction spatiale, c’est-à-dire du premier objet sonore).

Dans une deuxième implémentation du procédé de caractérisation, l’ensemble des objets sonores de la série sont reproduit spatialement dans l’ordre donné par la série (par exemple à l’instant prévu par la série). Le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3b et attend l’action de l’utilisateur. La requête d’interaction irq reproduite sur l’écran 10 est alors, par exemple « Indiquez dans l’ordre les différents directions d’où vous avez entendu un son». Le procédé de caractérisation reçoit alors une série d’actions (a(n)}n=1...N de l’utilisateur indiquant chacune au moins une deuxième localisation. Le procédé de caractérisation déclenche la comparaison une fois la série d’actions terminée et convertie en série de deuxième données fonction de ces actions (d2(n)= f(a(n))}n=1...N. La comparaison CMP vérifie, pour chaque première donnée associée di(n) à un premier objet sonore reproduit à un instant n, si la deuxième donnée d2(n) fournie par l’utilisateur pour cet instant n (par exemple parce que associée à la nième action de l’utilisateur) correspond à cette première donnée d1(n). La comparaison déclenche une caractérisation de l’utilisateur comme utilisateur approprié s’il y a correspondance de la série, dans l’ordre de la série. Par exemple, si l’utilisateur indique avoir entendu un son d’abord à droite, devant puis à nouveau à droite. Et, que la série de premiers objets sonores correspondait à une première localisation d’un premier objet sonore à droite, devant puis à droite, l’utilisateur est caractérisé comme utilisateur approprié. Par contre, si l’utilisateur indique avoir entendu un son à droite, à gauche puis à droite, l’utilisateur est caractérisé comme utilisateur non approprié.

La figure 3b illustre un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une position d’un objet sonore.

On pourra aussi avoir des sons différents en provenance de 3 directions (ou plus). L’utilisateur devra positionner un type de son donné (ex : chat) :

Dans le cas de la figure 3b, la scène audio 3D comporte, en particulier, plusieurs objets sonores de catégories distinctes ty_os. La génération de requête de position POSRQ_GN reçoit une information de sélection de la sélection d’objets sonores OSi_SLCT et génère une requête d’interaction irq comportant non seulement une question irqq mais aussi un sujet irqsbj. La question irqq porte notamment sur la localisation pos_os ? d’un objet sonore et le sujet indique que la question porte sur un objet sonore spécifique en indiquant qu’il s’agit d’un objet sonore dont la valeur d’un autre paramètre caractéristique est celle du premier objet sonore sélectionné, par exemple la requête d’interaction demande la localisation d’un objet sonore de type ty_os cri d’animal ou plus précisément un chat, un âne, etc.

Ainsi, la requête d’interaction irq reproduite sur l’écran 10 est par exemple « Où entendez-vous le chat ? ». Eventuellement, sur l’écran 10 est aussi reproduite un zone d’interaction avec le son ios. La zone d’interaction avec le son comporte un ou plusieurs des éléments d’interactions parmi les suivants : un élément d’interaction de lecture, une règle de lecture, un ascenseur de volume. En particulier, la requête d’interaction comporte des consignes relatives aux dispositifs de reproduction sonore à utiliser. Par exemple, elle demande une « écoute au casque uniquement ».

Eventuellement, la zone de réponse est constitué par une zone de saisie iz ou des choix multiples proposées iqcm qui seront sous forme de texte, tel que « devant » pour le choix fposrp, « droite » pour le choix rposrp et « gauche » pour le choix Iposrp et/ou représenté graphiquement par un dessin symbolique d’un utilisateur urp, et des cases ou cercles sélectionnâmes, par exemple en les cochant, comme le montre la figure 3a.

Eventuellement, le chat peut se déplacer dans la scène audio 3D sur une série de N premières localisations. Cela constitue une série d’objets sonores.

Dans une première implémentation du procédé de caractérisation, à chaque objet sonore de la série, c’est-à-dire à chaque nouvelle position du chat, le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3b et attend l’action de l'utilisateur. Le passage à une nouvelle position du chat est alors conditionné à un résultat de comparaison positif, c’est-à-dire au fait que l'utilisateur identifie correctement la position actuelle du chat (cela signifie que la deuxième donnée correspondant à la localisation du chat perçue par l'utilisateur correspond à la première donnée correspondant à la localisation actuelle du chat en cours de reproduction spatiale).

Dans une deuxième implémentation du procédé de caractérisation, l’ensemble des objets sonores de la série, c’est-à-dire le chat dans ses différentes positions, sont reproduit spatialement. Le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3b et attend l’action de l’utilisateur. La requête d’interaction irq reproduite sur l’écran 10 est alors, par exemple « Indiquez dans l’ordre les différents directions d’où vous avez entendu le chat». Le procédé de caractérisation reçoit alors une série d’actions {a(n)}n=1 ...N de l'utilisateur indiquant chacune au moins une deuxième localisation. Le procédé de caractérisation déclenche la comparaison une fois la série d’actions terminée et convertie en série de deuxième données fonction de ces actions {d2(n)= f(a(n))}n=1...N. La comparaison CMP vérifie, pour chaque première donnée associée di(n) à un premier objet sonore reproduit à un instant n, si la deuxième donnée d2(n) fournie par l’utilisateur pour cet instant n (par exemple parce que associée à la nième action de l'utilisateur) correspond à cette première donnée d1(n). La comparaison déclenche une caractérisation de l'utilisateur comme utilisateur approprié s’il y a correspondance de la série, dans l’ordre de la série. Par exemple, si l'utilisateur indique avoir entendu le chat d’abord à droite, devant puis à nouveau à droite. Et, que la série de premiers objets sonores correspondait à une première localisation du chat à droite, devant puis à droite, l’utilisateur est caractérisé comme utilisateur approprié. Par contre, si l’utilisateur indique avoir entendu le chat uniquement trois fois à droite, l’utilisateur est caractérisé comme utilisateur non approprié.

En particulier, l’utilisateur positionne l’objet sonore sur l’écran 10 par interaction par rapport à une représentation de la position de l’utilisateur urp. Le procédé de caractérisation est détermine alors la position fournie par l’utilisateur et utilisation la position de l’objet sonore ainsi déterminée dans la comparaison. L’avantage du placement libre de la position sur l’écran est plus difficile à contourner par un algorithme.

La figure 4a illustre un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une catégorie d’un objet sonore.

On pourra aussi avoir des sons différents en terme de catégorie de sources sonores en provenance de 3 directions (ou plus). L’utilisateur devra indiquer le type de son associé à une position donnée (ex : droite) :

Dans le cas de la figure 4a, la scène audio 3D comporte, en particulier, plusieurs objets sonores à des localisations distinctes pos₀s. La génération de requête de catégorie TYRQ_GN reçoit une information de sélection de la sélection d’objets sonores OSi_SLCT et génère une requête d’interaction irq comportant non seulement une question irqq mais aussi un sujet irqsbj. La question irqq porte notamment sur la catégorie ty_os ? de la source d’un objet sonore et le sujet indique que la question porte sur un objet sonore spécifique en indiquant qu’il s’agit d’un objet sonore positionné à une localisation ayant une valeur correspondant à celle du premier objet sonore sélectionné, par exemple la requête d’interaction demande la catégorie d’un objet sonore localisé pos_os à droite.

Ainsi, la requête d’interaction irq reproduite sur l’écran 10 est par exemple « Quel est l’origine du son à droite? ». Eventuellement, sur l’écran 10 est aussi reproduite un zone d’interaction avec le son ios. La zone d’interaction avec le son comporte un ou plusieurs des éléments d’interactions parmi les suivants : un élément d’interaction de lecture, une règle de lecture, un ascenseur de volume. En particulier, la requête d’interaction comporte des consignes relatives aux dispositifs de reproduction sonore à utiliser. Par exemple, elle demande une « écoute au casque uniquement ».

Eventuellement, la zone de réponse est constitué par une zone de saisie iz dans laquelle l’utilisateur saisie sa réponse au moyen d’un clavier ou d’un stylet, par exemple. En particulier, dans la zone de sélection d’un nouveau premier objet sonore, est reproduite la proposition suivante « Vous ne trouvez pas ? Générer un autre son ».

Eventuellement, différents sons, notamment une série de N premiers objets sonores associés respectivement à N premières catégories, peuvent se succéder en une même localisation de la scène audio 3D.

Dans une première implémentation du procédé de caractérisation, à chaque objet sonore de la série, c’est-à-dire à chaque nouvelle catégorie de son, le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3a et attend l’action de l’utilisateur. Le passage à un nouveau son est alors conditionné à un résultat de comparaison positif, c’est-à-dire au fait que l’utilisateur identifie correctement la catégorie actuelle du son de droite (cela signifie que la deuxième donnée correspondant à la catégorie perçue par l’utilisateur correspond à la première donnée correspondant à la catégorie actuelle de l’objet sonore en cours de reproduction spatiale).

Dans une deuxième implémentation du procédé de caractérisation, l’ensemble des objets sonores de la série sont reproduits spatialement, c’est-à-dire que plusieurs objets sonores sont successivement reproduits spatialement à droite. Le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3a et attend l’action de l’utilisateur. La requête d’interaction irq reproduite sur l’écran 10 est alors, par exemple « Indiquez dans l’ordre les différentes catégories de sons entendus à droite». Le procédé de caractérisation reçoit alors une série d’actions {a(n)}n=1 ...N de l’utilisateur indiquant chacune au moins une deuxième catégorie. Le procédé de caractérisation déclenche la comparaison une fois la série d’actions terminée et convertie en série de deuxième données fonction de ces actions {d2(n)= f(a(n))}n=1...N. La comparaison CMP vérifie, pour chaque première donnée associée di(n) à un premier objet sonore reproduit à un instant n, si la deuxième donnée d2(n) fournie par l’utilisateur pour cet instant n (par exemple parce que associée à la nième action de l’utilisateur) correspond à cette première donnée d1(n). La comparaison déclenche une caractérisation de l’utilisateur comme utilisateur approprié s’il y a correspondance de la série, dans l’ordre de la série. Par exemple, si l’utilisateur indique avoir entendu à droite d’abord un chat, une voiture puis à nouveau un chat. Et, que la série de premiers objets sonores correspondait à une première catégorie ayant pour valeur un chat, une voiture puis un chat, l’utilisateur est caractérisé comme utilisateur approprié. Par contre, si l’utilisateur indique avoir entendu à droite uniquement trois fois un chat, l’utilisateur est caractérisé comme utilisateur non approprié.

La figure 4b illustre un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’une requête d’interaction relative à une catégorie d’un objet sonore.

La différence avec l’interface utilisateur de la figure 4a réside dans la zone d’interaction qui comporte un choix multiple de réponses iqcm. En l’occurrence, le choix multiple comporte une mosaïque de 4 éléments d’interaction d , c2, c3 et c4 correspond à quatre choix de réponses distinctes. Sur chaque élément d’interaction de la mosaïque est reproduit notamment un contenu associé à une valeur de la catégorie de source sonore, tel qu’une image, une vidéo, etc. Parmi les choix sont proposés un choix correspondant à la première donnée d1, c’est-à-dire à la valeur de la première catégorie associée au premier objet sonore sélectionné reproduit spatialement.

Dans l’exemple de la figure 4b, le choix c1 correspond à une catégorie ayant pour valeur une voiture, c2 une vache, c3 la pluie et c4 une horloge. Ainsi, si le premier objet sonore sélectionné reproduit spatialement est une voiture, le son reproduit spatialement sera par exemple le bruit d’un moteur de voiture à la première localisation, par exemple à droite. A la vache pourra être associé comme signal sonore un cri de vache, c’est-à-dire un meuglement ; à la pluie, le clapotis de la pluie sur une surface ; à l’horloge, le tic-tac.

Ainsi, suite à la reproduction de la requête d’interaction demandant à l’utilisateur la catégorie correspondant au son à droite, si l’utilisateur sélectionne la vignette c1 de la mosaïque de choix multiples iqcm, la comparaison caractérisera l’utilisateur comme utilisateur approprié. Par contre, si l’utilisateur sélectionne n’importe laquelle des autres vignettes c2, c3 ou c4, la comparaison caractérisera l’utilisateur comme utilisateur non approprié.

L’avantage de la mosaïque dans le cas de l’utilisation d’une série d’objets sonores pour la caractérisation est que cela facilite l’interaction de l’utilisateur limitant les erreurs de caractérisation. En effet, si la série reproduite à droite est une vache, une voiture, une vache. L’utilisateur sélectionnant dans cet ordre les vignettes c2, c1 puis c2 sera caractérisé comme utilisateur approprié.

La figure 5a illustre un schéma simplifié d’une interface utilisateur d’un premier mode de réalisation de l’invention dans le cas d’un objet sonore comportant une requête d’interaction.

Eventuellement, les différents sons correspondent à différentes questions vocalisées en provenance de 3 directions (ou plus). L’utilisateur devra indiquer la réponse à la question vocalisée irqq portée par le son s associé à une position donnée pos_os (ex : droite) :

Dans le cas de la figure 5a, la scène audio 3D comporte, en particulier, plusieurs objets sonores à des localisations distinctes pos₀s. La génération de requête de réponse DRQ_GN reçoit une information de sélection de la sélection d’objets sonores OSi_SLCT et génère une requête d’interaction irq comportant seulement un sujet irqsbj puisque la question irqq est reproduite avec le son s. Le sujet indique que la question est reproduite avec un objet sonore spécifique en indiquant qu’il s’agit d’un objet sonore positionné à une localisation ayant une valeur correspondant à celle du premier objet sonore sélectionné, par exemple la requête d’interaction demande de répondre à la question posée par un objet sonore localisé pos_os à droite. Ainsi, la requête d’interaction irq reproduite sur l’écran 10 est par exemple « Répondez à la question venant de votre droite » ou « Merci de répondre à votre interlocuteur situé à votre droite ». Eventuellement, sur l’écran 10 est aussi reproduite un zone d’interaction avec le son ios. La zone d’interaction avec le son comporte un ou plusieurs des éléments d’interactions parmi les suivants : un élément d’interaction de lecture, une règle de lecture, un ascenseur de volume. En particulier, la requête d’interaction comporte des consignes relatives aux dispositifs de reproduction sonore à utiliser. Par exemple, elle demande une « écoute au casque uniquement ».

Eventuellement, la zone de réponse est constitué par une zone de saisie iz dans laquelle l’utilisateur saisie sa réponse au moyen d’un clavier ou d’un stylet, par exemple.

Eventuellement, différents sons, notamment une série de N premiers objets sonores associés respectivement à N premières réponses (c’est-à-dire dont les N signaux sonores comportent respectivement une des N questions vocalisées correspondant à ces N premières réponses), peuvent se succéder en une même localisation de la scène audio 3D.

Dans une première implémentation du procédé de caractérisation, à chaque objet sonore de la série, c’est-à-dire à chaque nouvelle question vocalisée, le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3b et attend l’action de l’utilisateur. Le passage à un nouveau son est alors conditionnée à un résultat de comparaison positif, c’est-à-dire au fait que l’utilisateur fournisse une réponse correcte à la question vocalisée dans le son de droite (cela signifie que la deuxième donnée correspondant à la réponse de la question perçue par l’utilisateur correspond à la première donnée correspondant à la réponse à la question actuellement vocalisée par l’objet sonore en cours de reproduction spatiale).

Dans une deuxième implémentation du procédé de caractérisation, l’ensemble des objets sonores de la série sont reproduit spatialement, c’est-à-dire que plusieurs objets sonores sont successivement reproduit spatialement à droite, en l’occurrence plusieurs questions sont posées successivement à droite. Le procédé de caractérisation déclenche un affichage de l’écran 10 de la figure 3a et attend l’action de l’utilisateur. La requête d’interaction irq reproduite sur l’écran 10 est alors, par exemple « Indiquez dans l’ordre les différentes réponses aux questions posées sur votre droite ». Le procédé de caractérisation reçoit alors une série d’actions (a(n)}n=1...N de l’utilisateur indiquant chacune au moins une deuxième réponse. Le procédé de caractérisation déclenche la comparaison une fois la série d’actions terminée et convertie en série de deuxième données fonction de ces actions (d2(n)= f(a(n))}n=1...N. La comparaison CMP vérifie, pour chaque première donnée associée di(n) à un premier objet sonore reproduit à un instant n, si la deuxième donnée d2(n) fournie par l’utilisateur pour cet instant n (par exemple parce que associée à la nième action de l’utilisateur) correspond à cette première donnée d1(n). La comparaison déclenche une caractérisation de l’utilisateur comme utilisateur approprié s’il y a correspondance de la série, dans l’ordre de la série. Par exemple, si l’utilisateur répond aux questions vocalisées, par exemple « quel est le président américain? », « combien font 1 plus 1 ?», « sur quel continent est la France? » entendu à droite d’abord « Bidden », « 2 » puis « Europe ». Et, que la série de premiers objets sonores correspondait à une première réponse ayant pour valeur « Bidden », « 2 » puis « Europe », l’utilisateur est caractérisé comme utilisateur approprié. Par contre, si l’utilisateur répond aux questions vocalisées entendues à droite « Macron», « 2 » puis « Europe », l’utilisateur est caractérisé comme utilisateur non approprié.

La figure 5b illustre un schéma simplifié d’une interface utilisateur d’un deuxième mode de réalisation de l’invention dans le cas d’un objet sonore comportant une requête d’interaction.

La différence avec l’interface utilisateur de la figure 5a réside dans la zone d’interaction qui comporte un choix multiple de réponses iqcm. En l’occurrence, le choix multiple comporte une liste de 3 éléments d’interaction c1 , c2, et c3 correspond à trois choix de réponses distinctes. Pour chaque élément d’interaction de la liste sont reproduit notamment un texte correspond à une valeur de première réponse. Parmi les choix sont proposés un choix correspondant à la première donnée d1 , en l’occurrence c3, c’est-à-dire à la valeur de la première réponse associée au premier objet sonore sélectionné reproduit spatialement portant une question vocalisée.

L’avantage de la liste dans le cas de l’utilisation d’une série d’objets sonores pour la caractérisation est que cela facilite l’interaction de l’utilisateur limitant les erreurs de caractérisation. En effet, si les réponses aux questions vocalisées avec la série reproduite à droite sont c3, c1 , puis c2. L’utilisateur sélectionnant dans cet ordre les éléments de la liste c3, c1 puis c2 sera caractérisé comme utilisateur approprié.

Eventuellement, lorsque la série concerne une localisation donnée, la question de la requête d’interaction peut porter sur différents paramètres caractéristiques des objets sonores de la série. Par exemple, la requête d’interaction demande à l’utilisateur d’écouter le son de droite, pour le premier objet, il fournira une valeur de catégorie de l’objet sonore reproduit spatialement à droite, pour le second, il répondra à la question posée vocalement, pour le troisième, cela pourra être à nouveau une valeur de catégorie... A noter qu’à un objet sonore comportant une question vocalisée pourra être associé une valeur de catégorie correspondant à une catégorie de personne ou de voix : homme, femme, enfant, aigue, grave, forte, murmure, accent anglais, accent méridional, etc.

La figure 6 illustre un schéma simplifié d’une architecture de communication comportant un dispositif de caractérisation selon l’invention. Le dispositif de caractérisation 33 d’un utilisateur U comporte un comparateur 334 de premières données d1 associées à un premier objet sonore spatialisé OS¹ en une première localisation pos¹os d’une scène audio spatialisée 3DES par une interface utilisateur 2 d’un terminal de communication 1 et de deuxièmes données d2 reçues suite à la reproduction du premier objet sonore spatialisé OSi, les premières données d1 étant distinctes du premier objet sonore OS1 , les deuxièmes données d2 étant fonction d’un deuxième objet sonore spatialisé perçu OS² en une deuxième localisation pos² ₀s de la scène audio spatialisée 3DES, le comparateur 334 déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié.

En particulier, le dispositif de caractérisation 33 comporte un sélecteur 330 d’un environnement sonore dans un dispositif de stockage 331 , tel qu’une mémoire ou une base de données, comportant un ou plusieurs environnements sonores prédéfinis. En particulier, la base de données, est une base de sons ou une base d’objets sonores voire une base d’environnements sonores. Le sélecteur d’environnement sonore 330 reçoit du dispositif de stockage 331 un environnement sonore es composé :

- soit d’un ou plusieurs premiers objets sonores OSi, {OS¹i}i,

- soit d’un ou plusieurs couples formés par :

+ un premier objet sonore et une première réponse à une question vocalisée incluse dans le premier objet sonore (OS¹, r¹ _0s=d1), {(OS¹i, r¹ _0Si)}i,

+ etc.

- soit un ou plusieurs n-uplets formés par un premier objet sonore et un ou plusieurs des paramètre suivants : une première localisation, une première catégorie de source sonore, une première réponse, etc. (OS¹, pos¹ _os, ty¹ _os), {(OS¹·, posV ty¹ _0Si)}i, (OS¹, pos¹ _os, r¹ _os=d1), {(OS¹·, posV r¹ _0Si)}i, (OS¹, ty¹os, r¹os=d1), {(OS¹i, ty¹osi, r¹osi)}i(OS¹, pos¹os, ty¹os, r¹os⁼d1), {(OS¹i, pos¹osi, ty¹osi, r¹osï)}ï, etc. Notamment, le sélecteur d’environnement sonore 330 envoie une requête d’environnement sonore es_req au dispositif de stockage331 , et reçoit l’environnement sonore es en réponse à la requête d’environnement sonore es_req.

En particulier, le dispositif de caractérisation 33 comporte un générateur 332 de requête d’interaction irq concernant un premier objet sonore : seul objet sonore OS¹ ou objet sonore sélectionné OS¹jde l’environnement sonore sélectionné es. La requête d’interaction irq porte sur un ou plusieurs paramètres caractéristiques du premier objet sonore OS¹, OS¹j.

En particulier, le générateur 332 de requête d’interaction irq comporte un ou plusieurs des dispositifs suivants (non illustrés):

- un vérificateur du nombre d’objets sonore de l’environnement sonore sélectionné i = 1 ?;

- le cas échéant, un sélecteur d’objet sonore dans l’environnement sonore sélectionné ; - un vérificateur de présence d’au moins un paramètre caractéristique associé au premier objet sonore sélectionné OS¹j : notamment, un vérificateur de présence d’une réponse à une question vocalisée dans le premier objet sonore sélectionné, un vérificateur de présence d’une catégorie du premier objet sélectionné, etc. ;

- au moins un générateur d’une requête d’interaction spécifique, notamment un générateur d’une requête d’interaction relative à la localisation du premier objet, et/ou un générateur d’une requête d’interaction relative à la question vocalisée dans le premier objet sonore, et/ou un générateur de requête relative à une catégorie de source, etc.

- un sélecteur de requête;

- etc.

Le générateur de requête d’interaction 332 fournissent une requête d’interaction irq relative à un premier objet sonore, voire à une première série de premiers objets sonores, comportant éventuellement une ou plusieurs requêtes spécifiques relatives à un paramètre caractéristique associé au premier objet sonore, voire à la première série de premiers objets sonores, à un dispositif de reproduction de requête d’interaction 10, 2. Le dispositif de reproduction de requête d’interaction est notamment un dispositif de reproduction visuelle telle qu’un affichage sur un écran 10, un casque de réalité virtuel ou augmenté, etc. (la reproduction visuelle étant préalable ou simultanée à la reproduction de l’environnement sonore spatialisée 3D_RPR) et/ou un dispositif de reproduction sonore 2, la reproduction de la requête d’interaction étant alors préalable à la reproduction de l’environnement sonore spatialisée.

En particulier, le dispositif de reproduction de l’environnement sonore spatialisée 2 est commandé déclenchée par l’un des dispositifs suivants : le sélecteur de l’environnement sonore 330, le générateur de requête d’interaction 332, le dispositif de reproduction 10, 2 lors de la reproduction de la requête d’interaction.

Suite à la reproduction de la requête d’interaction IRQ_RPR, l’utilisateur UH, UR réagit a en fournissant des deuxièmes données d2 relatives à un deuxième objet sonore OS² au moyen d’une interface utilisateur 10, 11 du terminal de communication 1. Le deuxième objet sonore OS² est l’objet sonore dont le deuxième signal sonore ou deuxième son s² est perçu par l’utilisateur dans l’environnement sonore spatialisé reproduit 3DES qui correspond pour l’utilisateur au premier objet sonore OS1 auquel la requête d’interaction irq reproduite est relative.

Le dispositif de caractérisation 33 reçoit de l’utilisateur, éventuellement d’une interface utilisateur du terminal de communication 1, ces deuxièmes données d2. En particulier, le dispositif de caractérisation 33 comporte un ou plusieurs des dispositifs suivants (non illustrés):

- un récepteur de données recevant des données provenant d’une interface utilisateur, notamment des données captées de ou une action a, et fournissant des données reçues dr ;

- un extracteur de deuxièmes données XTR de données reçues dr et/ou captées de. Notamment, l’interface utilisateur 10, 11 comporte un ou plusieurs des dispositifs suivants (non illustrés):

- un capteur d’une action a de l’utilisateur fournissant des données captées de, tel qu’une caméra, un microphone, un écran tactile, etc.;

- un récepteur de données recevant des données saisies par l’utilisateur sur un périphérique (non illustré, tel qu’un clavier, une souris, etc.) du terminal de communication 1 ;

En particulier, le comparateur 334 déclenche, en cas de résultat positif [N], une caractérisation de la source d’interaction comme étant un utilisateur non-approprié cru=ia.

Dans un mode de réalisation particulier, l’architecture de communication comporte un dispositif de fourniture de services 3. Le dispositif de fourniture de service comporte :

+ un processeur 32 apte à mettre en oeuvre au moins un service ;

+ une interface 31 d’échange avec un terminal de communication 1 ; et

+ un dispositif de caractérisation 33 d’un utilisateur du service comportant un comparateur 334 de premières données associées à un premier objet sonore spatialisé en une première localisation d’une scène audio spatialisée par une interface utilisateur du terminal de communication de l’utilisateur et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données d1 étant distinctes du premier objet sonore OS1, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation de la scène audio spatialisée, le comparateur déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié et commandant au processeur la mise en oeuvre du service.

En particulier, le dispositif de caractérisation 33 est activé par le dispositif de fourniture de services 3, en particulier préalablement à la fourniture du service. La fourniture du service sera déclenchée par la caractérisation de la source d’interaction comme étant un utilisateur approprié, en particulier un utilisateur humain. Eventuellement, dans le cas d’une caractérisation de la source d’interaction comme étant un utilisateur non-approprié, en particulier un utilisateur robot ou agent informatique, le procédé de caractérisation déclenche l’arrêt du dispositif de fourniture de services 3.

Dans l’exemple de la figure 6, l’architecture de communication comporte un dispositif de caractérisation selon l’invention 33 notamment implémenté dans un dispositif de fournitures de services 3 selon l’invention. L’utilisateur U que le dispositif de caractérisation 33 doit caractériser interagit notamment avec le dispositif de caractérisation 33 au moyen d’un terminal de communication 1 connecté au dispositif de caractérisation 33 et, le cas échéant au dispositif de fourniture de services 3 notamment via un réseau de communication 4. Le dispositif de caractérisation 3 utilise notamment comme dispositif de reproduction de son 3D ou son spatialisé un casque 2 porté par l’utilisateur U. Le casque 2 constitue notamment un périphérique du terminal de communication 1.

Par exemple, l’utilisateur U souhaite télécharger au moyen de son terminal de communication 1 un contenu fournit par le dispositif de fourniture de services 3. Le terminal de communication 1 requiert le contenu (non illustré) au dispositif de fourniture de services 3 qui active le dispositif de caractérisation 33 pour éviter les spams de requête de contenu.

Le sélecteur d’environnement sonore 330 sélectionne un environnement sonore es dans le dispositif de stockage 331. Ensuite, le générateur de requête d’interaction 332 utilise au moins un des objets sonores de l’environnement sonore sélectionné fourni par le sélecteur 333 pour établir une requête d’interaction irq. Dans l’exemple de la figure 6, le dispositif de caractérisation 33 comporte un contrôleur 333 commandant la reproduction sonore spatialisé de l’environnement sonore sélectionné notamment en fournissant un signal sonore spatialisé 3Dss. Eventuellement, le générateur de requête d’interaction 332 déclenche rpr_trg la commande de reproduction sonore spatialisée par le contrôleur 333.

En particulier, lorsque le dispositif de caractérisation 33 et le dispositif de reproduction de son spatialisé 2 ne sont pas co-localisés, le dispositif de caractérisation fournit le signal sonore spatialisé de l’environnement sonore sélectionné 3Dss à un émetteur 31 implémenté dans le dispositif de caractérisation 33 et/ou dans le dispositif de fourniture de service 3 implémentant le dispositif de caractérisation 33. L’émetteur 31 transmet le signal spatialisé 3Dss au terminal de communication 1 qui le reçoit notamment au moyen d’un récepteur 13. Le récepteur 13 fournit, notamment au moyen d’une interface périphérique 12, ce signal spatialisé 3Dss au dispositif de reproduction sonore spatialisé 2.

En particulier, lorsque le dispositif de caractérisation 33 et le dispositif de reproduction de requête 10 ne sont pas co-localisé, le générateur de requête d’interaction 332 fournit la requête générée irq à un émetteur 31 implémenté dans le dispositif de caractérisation 33 et/ou dans le dispositif de fourniture de service 3 implémentant le dispositif de caractérisation 33. L’émetteur 31 transmet la requête d’interaction irq au terminal de communication 1 qui la reçoit notamment au moyen d’un récepteur 13. Le récepteur 13 fournit cette requête irq au dispositif de reproduction 10, par exemple à l’écran du terminal de communication 1.

Le terminal 1 comporte une interface utilisateur 10, 11 recevant une action a de l’utilisateur U suite aux reproductions de la requête d’interaction et de l’environnement sonore spatialisé, et fournissant des données reçues ou captées di, de correspondant à cette action a. Ces données di, de sont fournies au dispositif de caractérisation 33 notamment au moyen d’un émetteur 13 du terminal de communication et un récepteur 31 implémenté dans le dispositif de caractérisation 33 et/ou dans le dispositif de fourniture de service 3 implémentant le dispositif de caractérisation 33.

Le comparateur 334 compare alors les deuxièmes données d2 provenant des données reçues ou captées di, de du terminal de communication 1 avec les premières données d1 associées à l’objet sonore sélectionné par le générateur de requête d’interaction 332. En cas de correspondance entre les premières et deuxièmes données d1, d2 alors le comparateur 334 caractérise cru=h l’utilisateur U comme approprié (par exemple utilisateur humain) et, le cas échéant, en informe le dispositif de fourniture de services 3 qui fournit alors le contenu requis.

Dans un mode de réalisation non illustré, le dispositif de caractérisation 33 est implémenté dans un terminal de communication 1 , notamment le terminal de communication 1 constituant un dispositif de fourniture de services.

Dans un mode de réalisation particulier non illustré, le dispositif de caractérisation 33 est activé par un dispositif d’accès à un dispositif tiers (terminal de communication 1 , objet connecté, équipement distant..), en particulier préalablement à l’autorisation d’accès au dispositif tiers. L’accès au dispositif tiers sera déclenché par la caractérisation de la source d’interaction comme étant un utilisateur approprié, en particulier un utilisateur humain. Eventuellement, dans le cas d’une caractérisation de la source d’interaction comme étant un utilisateur non-approprié, en particulier un utilisateur robot ou agent informatique, le procédé de caractérisation déclenche l’arrêt STP de la mise en oeuvre du procédé d’accès au dispositif tiers.

Dans un mode de réalisation particulier, le contrôleur 33 fournit une paire de filtres binauraux qui encode la localisation spatialisé de l’objet sonore au dispositif de reproduction sonore spatialisé. En particulier, lorsque l’utilisateur demande une nouvelle reproduction du même objet sonore, le contrôleur fournit une paire de filtres binauraux distincte de la paire fournit lors de la précédente reproduction. Cela engendre une légère modification de la perception de la localisation de l’objet sonore.

En effet, une paire de filtres binauraux représente la façon dont un être humain donné perçoit physiquement un son provenant d’une position donnée dans l’espace lorsqu’il arrive aux abords de ses conduits auditifs (un filtre pour l’oreille droite, un filtre pour l’oreille gauche). Les filtres binauraux sont donc individuels, et pour un humain donné, seuls ses filtres à lui permettent de lui simuler parfaitement la spatialisation sonore. Cependant, pour des positions azimutales très marquées (typiquement en face de l’oreille droite, en face de l’oreille gauche et en face du sujet), une modification des filtres binauraux ne suffisent pas à brouiller la perception spatiale. Un changement aléatoire de ces filtres à chaque captcha, soient qu’ils soient piochés dans une base de données déjà constituée, ou modifiés algorithmiquement en temps-réel permet de rendre le dispositif de caractérisation plus robuste car ajoutant une difficulté supplémentaire permettant de contourner les algorithmes de reconnaissance.

L'invention vise aussi un support. Le support d'informations peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique ou encore un moyen d'enregistrement magnétique, par exemple une disquette ou un disque dur.

D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau notamment de type Internet.

Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.

Dans une autre implémentation, l'invention est mise en œuvre au moyen de composants logiciels et/ou matériels. Dans cette optique le terme module peut correspondre aussi bien à un composant logiciel ou à un composant matériel. Un composant logiciel correspond à un ou plusieurs programmes d'ordinateur, un ou plusieurs sous-programmes d'un programme, ou de manière plus générale à tout élément d'un programme ou d'un logiciel apte à mettre en œuvre une fonction ou un ensemble de fonction selon la description ci-dessus. Un composant matériel correspond à tout élément d'un ensemble matériel (ou hardware) apte à mettre en œuvre une fonction ou un ensemble de fonctions.

L’invention permet de rajouter une nouvelle modalité de caractérisation de l’utilisation, notamment différenciation entre un utilisateur humain et une machine utilisatrice, plus complexe à contourner de manière automatique. Elle pourrait servir de captcha aux non-voyants puisqu’elle est basée sur la reconnaissance de paramètre caractéristique relatif à un objet sonore à condition que la requête d’interaction soit reproduite de manière perceptible par un non-voyant, par exemple reproduction vocale ou reproduction en relief (aussi nommée reproduction Braille).

Dans une variante de l’invention, le procédé de caractérisation comporte un déverrouillage d’un ordinateur en obligeant l’utilisateur à mettre son casque audio, par exemple, pour une application dont l’usage du son est indispensable (ex : pub, instruction sur un site industriel, démarrage d’un audiophone après être sûr que tu entends bien, ...).

Le procédé de caractérisation utilisant le son 3D selon l’invention permet donc également de vérifier que le casque est mis dans le bon sens. C’est un captcha « augmenté » qui va au-delà de l’aspect sécurité. Cela peut permettre de déverrouiller une appli avec l’aide la position du son 3D. Dans la variante de l’invention utilisant des techniques de spatialisation de son aux moyens d’enceintes telles que les techniques transaurale, WSF, Ambisonic,5.1, etc., le procédé de caractérisation pourra éventuellement être utilisé comme une vérification de la conformité de la position de l'utilisateur par rapport à la scène sonore. Par exemple, on présente la scène sonore à l'utilisateur, on lui demande par exemple où se trouve la vache, si sa réponse est mauvaise on lui demande de se repositionner avec les instructions adaptées et on recommence. Cela est particulièrement utile dans le cadre d'une calibration d'un système sonore 3D qu'on vient d'acheter et qu'on reçoit chez soi. La manœuvre permettra de s'assurer que l'utilisateur est bien placé et profitera pleinement de la scène sonore qui lui sera offerte.

Claims

REVENDICATIONS

1. Procédé de caractérisation d’un utilisateur, le procédé de caractérisation comportant une comparaison de premières données associées à un premier objet sonore spatialisé en une première localisation d’une scène audio spatialisée par une interface utilisateur d’un terminal de communication et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation de la scène audio spatialisée, la comparaison déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié,.

2. Procédé de caractérisation d’un utilisateur d’un service selon la revendication précédente, dans lequel les premières données et les deuxièmes données sont une parmi les types de données suivantes :

+ un paramètre de localisation d’un objet sonore spatialisé ;

+ une catégorie de source génératrice d’un objet sonore ;

+ une réponse à une question vocalisée dans un objet sonore ;

3. Procédé de caractérisation d’un utilisateur d’un service selon l’une quelconque des revendications précédentes, dans lequel le procédé de caractérisation comporte une reproduction d’une requête d’interaction au premier objet sonore spatialisé, la requête d’interaction étant destinée à l’utilisateur, les deuxièmes données sont des données reçues suite à la reproduction de ladite requête d’interaction.

4. Procédé de caractérisation d’un utilisateur d’un service selon la revendication précédente, dans lequel la requête d’interaction comporte le type de deuxièmes données attendues lors de l’interaction.

5. Procédé de caractérisation d’un utilisateur d’un service selon la revendication précédente, dans lequel la requête d’interaction comporte en outre la deuxième localisation du deuxième objet sonore spatialisé, la deuxième localisation correspondant à la première localisation.

6. Procédé de caractérisation d’un utilisateur selon l’une quelconque des revendications précédentes, dans lequel le procédé de caractérisation d’un utilisateur caractérise l’utilisateur d’au moins un des éléments suivants :

+ un service mis en œuvre par un dispositif de fourniture de service ;

+ d’un dispositif parmi les dispositifs suivants :

- le terminal de communication ;

- un dispositif de traitement local ou réseau ;

- un dispositif de fourniture de services ;

7. Procédé de caractérisation selon l’une quelconque des revendications précédentes, dans lequel le procédé de caractérisation comporte un contrôle mis en œuvre par l’interface utilisateur, le contrôle contrôlant l’interface utilisateur au moyen d’une commande de reproduction spatialisée comportant le premier objet sonore et la première localisation.

8. Procédé de caractérisation selon la revendication précédente, dans lequel le contrôle déclenche une activation d’une capture de deuxièmes données par l’interface utilisateur, les données captées comportant les deuxièmes données reçues.

9. Programme comprenant des instructions de code de programme pour l’exécution des étapes du procédé de caractérisation selon l’une quelconque des revendications précédentes lorsque ledit programme est exécuté par un processeur.

10. Dispositif de caractérisation d’un utilisateur, le dispositif de caractérisation comportant un comparateur de premières données associées à un premier objet sonore spatialisé en une première localisation d’une scène audio spatialisée par une interface utilisateur d’un terminal de communication et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation de la scène audio spatialisée, le comparateur déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié.

11. Dispositif de fourniture de services, le dispositif de fourniture de service comportant :

+ un processeur apte à mettre en oeuvre au moins un service ;

+ une interface d’échange avec un terminal de communication ; et + un dispositif de caractérisation d’un utilisateur du service comportant un comparateur de premières données associées à un premier objet sonore spatialisé en une première localisation d’une scène audio spatialisée par une interface utilisateur du terminal de communication de l’utilisateur et de deuxièmes données reçues suite à la reproduction du premier objet sonore spatialisé, les premières données étant distinctes du premier objet sonore, les deuxièmes données étant fonction d’un deuxième objet sonore spatialisé perçu en une deuxième localisation de la scène audio spatialisée, le comparateur déclenchant en cas de résultat positif une caractérisation de la source d’interaction comme étant un utilisateur approprié et commandant au processeur la mise en oeuvre du service.