FR3039026A1 - Methode pour transmettre une information a enregistrer - Google Patents

Methode pour transmettre une information a enregistrer Download PDF

Info

Publication number
FR3039026A1
FR3039026A1 FR1501497A FR1501497A FR3039026A1 FR 3039026 A1 FR3039026 A1 FR 3039026A1 FR 1501497 A FR1501497 A FR 1501497A FR 1501497 A FR1501497 A FR 1501497A FR 3039026 A1 FR3039026 A1 FR 3039026A1
Authority
FR
France
Prior art keywords
sound signal
signal
transmission
transmitter
recipient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1501497A
Other languages
English (en)
Other versions
FR3039026B1 (fr
Inventor
Daniel Pressnitzer
Laure Cornu
Lous Herve Le
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Ecole Superieure de Physique et Chimie Industrielles de Ville Paris
Ecole Normale Superieure
Urgo Recherche Innovation et Developpement
Universite Paris Cite
Original Assignee
Centre National de la Recherche Scientifique CNRS
Universite Paris Diderot Paris 7
Ecole Superieure de Physique et Chimie Industrielles de Ville Paris
Ecole Normale Superieure
Fonds ESPCI Georges Charpak
Vivatech Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Universite Paris Diderot Paris 7, Ecole Superieure de Physique et Chimie Industrielles de Ville Paris , Ecole Normale Superieure, Fonds ESPCI Georges Charpak , Vivatech Co filed Critical Centre National de la Recherche Scientifique CNRS
Priority to FR1501497A priority Critical patent/FR3039026B1/fr
Priority to US15/744,939 priority patent/US10673538B2/en
Priority to PCT/EP2016/066369 priority patent/WO2017009266A1/fr
Publication of FR3039026A1 publication Critical patent/FR3039026A1/fr
Application granted granted Critical
Publication of FR3039026B1 publication Critical patent/FR3039026B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B11/00Transmission systems employing sonic, ultrasonic or infrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Telephonic Communication Services (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

L'invention concerne une méthode pour transmettre une information dans un canal de communication reliant un transmetteur à un destinataire, la méthode comprenant les étapes successives suivantes : la détermination, par le transmetteur, d'un premier signal sonore intelligible représentatif de ladite information à transmettre, le traitement acoustique, par le transmetteur, dudit premier signal sonore afin de produire un second signal sonore inintelligible pour le destinataire, la transmission dudit second signal sonore du transmetteur vers le destinataire, la transmission dudit premier signal sonore du transmetteur vers le destinataire, ladite transmission dudit premier signal sonore étant déclenchée par ladite transmission dudit second signal sonore, la deuxième transmission dudit second signal sonore du transmetteur vers le destinataire, ladite deuxième transmission dudit second signal sonore étant déclenchée par ladite transmission dudit premier signal.

Description

METHODE POUR TRANSMETTRE UNE INFORMATION A
ENREGISTRER
DOMAINE DE L’INVENTION
La présente invention concerne de manière générale une méthode pour transmettre une information dans un canal de communication reliant un transmetteur à un destinataire.
ARRIERE-PLAN TECHNOLOGIQUE
La capacité d’enregistrer, de conserver et de restituer une information est depuis longtemps un thème d’étude central pour les processus d’acquisition de connaissance. Les conditions relatives à la capacité d’enregistrer, de conserver et de restituer une information ne sont pas toujours pleinement connues, en dépit d’applications potentielles évidentes. Ce qui est connu est que la façon dont une information a été traitée pendant la phase de transmission peut être critique pour les performances relatives à l’enregistrement, la conservation et la restitution d’une information. En particulier, la manière de transmettre et de traiter l’information semble avoir un effet important. Des expériences ont montré que les performances relatives à la capacité d’enregistrer, de conserver et de restituer une information étaient d’autant meilleures que l’information à transmettre induisait un traitement profond demandant au destinataire de l’information d’élaborer volontairement autour du sens de l’information à enregistrer, conserver et restituer. Ceci a été interprété en proposant que la capacité d’enregistrer, de conserver et de restituer une information soit intimement liée à la manière dont une information est transmise et traitée. Ainsi, moduler la manière dont une information est traitée pendant la phase de transmission a naturellement un effet direct sur la capacité d’enregistrer, de conserver et de restituer une information.
Il a depuis été montré qu’une information ambiguë initialement difficile à comprendre, dont le sens est révélé par un indice ultérieur, était très efficacement enregistrée, conservée et restituée. Un essai typique d’expériences menées par Auble et Franks consistait par exemple à présenter une première information consistant en la phrase « la botte de foin a été utile car la toile s’était déchirée ». Après une pause de 5 secondes, une deuxième information « parachute » apparaissait à l’écran. Une fois l’information «parachute » transmise au destinataire, le sens de la phrase « la botte de foin a été utile car la toile s’était déchirée » devenait parfaitement clair. Pour de tels essais, avec des indices consistant en une information, la capacité de restitution de l’information transmise au destinataire était bien meilleure que pour d’autres essais où le sens de la première information était initialement clair. Il a été montré que la perplexité causée initialement par l’inintelligibilité de la première information permet un traitement plus profond et une plus grande capacité d’enregistrement, de conservation et de restitution des données.
Ces techniques antérieures permettant de transmettre une information en vue de l’enregistrer, la conserver et la restituer mettent en œuvre la résolution d’une ambiguïté sémantique de l’information à transmettre.
De telles techniques nécessitent l’utilisation d’une information qui est un matériau verbal dont le traitement nécessite une intervention humaine pour la définition des termes de la première information inintelligible. D’autre part, la mise en œuvre de telles techniques est difficilement reproductible.
RESUME DE L’INVENTION
Dans ce contexte, le problème ici posé est de proposer une méthode permettant d’améliorer les capacités d’enregistrement, de conservation et de restitution d’une information pour un destinataire. Plus particulièrement, le problème visé par la présente invention est d’améliorer la reproductibilité de la méthode tout en évitant une intervention humaine.
La solution proposée par la présente invention est que la méthode pour transmettre une information dans un canal de communication reliant un transmetteur à un destinataire comprenne les étapes successives suivantes : la détermination, par le transmetteur, d’un premier signal sonore intelligible représentatif de ladite information à transmettre, le traitement acoustique, par le transmetteur, dudit premier signal sonore afin de produire un second signal sonore inintelligible pour le destinataire, la transmission dudit second signal sonore du transmetteur vers le destinataire, la transmission dudit premier signal sonore du transmetteur vers le destinataire, ladite transmission dudit premier signal sonore étant déclenchée par ladite première transmission dudit second signal sonore, la deuxième transmission dudit second signal sonore du transmetteur vers le destinataire, ladite deuxième transmission dudit second signal sonore étant déclenchée par ladite transmission dudit premier signal.
Une telle méthode pour transmettre une information permet de pallier les inconvénients précités et permet d’améliorer les capacités d’enregistrement, de conservation et de restitution d’une information pour un destinataire. Cette méthode présente plusieurs avantages par rapport aux techniques antérieures. Les capacités d’enregistrement, de conservation et de restitution d’une information sont induites par un traitement acoustique permettant ainsi l’utilisation d’un premier signal comprenant un matériau verbal totalement arbitraire. L’effet induit par le traitement acoustique est spécifique à un premier signal sonore intelligible lequel est susceptible de contenir une variété infini d’information à transmettre, laquelle information pouvant être de toute nature, telle une information éducative.
Dans un mode de réalisation, les étapes de transmission dudit premier signal sonore du transmetteur vers le destinataire, ladite transmission dudit premier signal sonore étant déclenchée par ladite transmission dudit second signal sonore et de deuxième transmission dudit second signal sonore du transmetteur vers le destinataire, ladite deuxième transmission dudit second signal sonore étant déclenchée par ladite transmission dudit premier signal sont déclenchées après une durée prédéterminée, préférentiellement une durée sensiblement égale à 250 ms.
Dans un mode de réalisation, durant l’étape de traitement, un algorithme de traitement est mis en œuvre pour produire ledit second signal, l’algorithme de traitement mettant en œuvre les étapes suivantes : échantillonner une première fois ledit premier signal sonore, filtrer ledit premier signal sonore de manière à laisser passer des hautes fréquences dudit premier signal sonore sans les atténuer, lesdites hautes fréquences étant préférentiellement prédéfinies comme étant supérieures à 50 Hz, et atténuer des basses fréquences relativement inférieures auxdites hautes fréquences, puis sous-échantillonner ledit premier signal sonore.
Dans un mode de réalisation, lors du premier échantillonnage dudit premier signal sonore, la première fréquence d’échantillonnage est sensiblement égale à 44.1 kHz.
Dans un mode de réalisation,, dans laquelle, lors du premier échantillonnage dudit premier signal sonore, la résolution de quantification est sensiblement égale à 16 bits.
Dans un mode de réalisation, l’atténuation desdites basses fréquences inférieures à 50 Hz est de 6 dB par octave.
Dans un mode de réalisation, lors du sous-échantillonnage, la deuxième fréquence d’échantillonnage est sensiblement égale à 10 kHz.
Dans un mode de réalisation, la méthode comprend des étapes consécutives à l’étape de sous-échantillonnage dudit premier signal sonore : diviser ledit premier signal définissant un signal d’entrée d’un filtre sous-échantillonné en une pluralité de segments présentant une durée prédéterminée, analyser chaque segment pour fournir les coefficients d’un filtre prédicteur, lesdits coefficients dudit filtre prédicteur étant variables dans le temps, lesdits coefficients étant utilisés pour prédire une valeur du segment, déterminer la corrélation existante entre des segments consécutifs parmi ladite pluralité de segments de manière à déterminer l’inintelligibilité du signal, déterminer l’erreur de la prédiction en comparant, pour chaque segment, la valeur prédite du segment et sa valeur mesurée en entrée du filtre, implémenter un filtrage en fonction de l’erreur de la prédiction et de la corrélation existante de manière à définir le second signal sonore inintelligible pour le destinataire.
Dans un mode de réalisation, la méthode comprend une étape consistant, lors de l’étape d’implémentation du filtrage en fonction de l’erreur de la prédiction et de la corrélation existante, à filtrer pour chaque segment au moins trois formants afin de définir un tracé formantique représentatif dudit deuxième signal.
Dans un mode de réalisation, la méthode comprend une étape consistant à imposer une distance fréquentielle minimale entre deux formants.
BREVE DESCRIPTION DES FIGURES D’autres caractéristiques et avantages ressortiront encore de la description qui est faite ci-après à titre indicatif et nullement limitatif, en référence aux dessins annexés, dans lesquels : - la figure 1 illustre une analyse temps-fréquence des signaux utilisés dans un exemple de réalisation de l’invention sur une échelle de fréquence logarithmique, avec l’amplitude indiquée par le niveau de gris/ les motifs; la figure 2 illustre la procédure expérimentale pour évaluer l’impact d’un exemple de réalisation de la méthode visée par l’invention ; la figure 3 illustre les résultats issus de la procédure expérimentale représentée sur la figure 2, les résultats présentant le nombre de détections correctes et de fausses alarmes en fonction de la méthode utilisé pour transmettre l’information au destinataire; la figure 4 illustre les jugements de confiance portés par les auditeurs à propos de leur réponse sur la tâche de mémorisation. Les résultats montrent que les auditeurs ne sont pas conscients que la méthode décrite par l’invention améliore leurs performances de mémorisation. DESCRIPTION DETAILLEE DE L’INVENTION Exemples de de modes de réalisation de l’invention L’invention concerne une méthode pour transmettre une information dans un canal de communication reliant un transmetteur à un destinataire. Un tel canal de communication peut, par exemple, être un réseau de données comme internet. Le canal de transmission peut être filaire ou sans fil, l’invention étant indépendante de l’infrastructure sous-jacente utilisée pour mettre en œuvre l’invention. L’originalité de l’invention consiste à améliorer les capacités d’enregistrement, de conservation et de restitution d’une information pour un destinataire, non pas par la résolution d’une ambigüité sémantique, mais plutôt par la manière de transmettre et de traiter l’information, notamment via un traitement acoustique de l’information à transmettre.
La méthode pour transmettre l’information dans le canal de communication reliant le transmetteur au destinataire comprend les étapes successives suivantes : a) la détermination, par le transmetteur, d’un premier signal sonore intelligible représentatif de ladite information à transmettre, b) le traitement acoustique, par le transmetteur, dudit premier signal sonore afin de produire un second signal sonore inintelligible pour le destinataire, c) la transmission dudit second signal sonore du transmetteur vers le destinataire, d) la transmission dudit premier signal sonore du transmetteur vers le destinataire, ladite transmission dudit premier signal sonore étant déclenchée par ladite première transmission dudit second signal sonore, e) la deuxième transmission dudit second signal sonore du transmetteur vers le destinataire, ladite deuxième transmission dudit second signal sonore étant déclenchée par ladite transmission dudit premier signal.
Typiquement, les étapes d) et e) sont déclenchées après une durée prédéterminée, préférentiellement une durée sensiblement égale à 250 ms.
Dans un mode de réalisation de l’invention, le traitement acoustique est réalisé en mettant en œuvre un algorithme dit « sine-wave speech » pour traiter l’information consistant généralement en un matériau de parole. Pour un destinataire naïf, le deuxième signal issu de l’algorithme de traitement « sine-wave speech » ne permet pas d’identifier que du matériau verbal ou des paroles sont contenus dans ce deuxième signal. L’auditeur entendrait plutôt une série de bruits électroniques inintelligibles. Classiquement, une phrase intelligible est une phrase que l’on comprend, c’est-à-dire une phrase dont on peut saisir le sens. Au contraire, une phrase inintelligible est une phrase que l’on ne comprend pas, c’est-à-dire une phrase dont on ne peut pas saisir le sens. Dans le contexte de la présente invention, une phrase présentée sous forme de signal sonore est considérée comme intelligible si au moins la moitié de ses mots sont compris. A l’inverse, une phrase est considérée inintelligible si moins de la moitié de ses mots sont non-compris. La compréhension des mots peut être établie par un rapport écrit des auditeurs, qui sera comparé mot pour mot avec la phrase présentée.
Plus précisément, l’algorithme de traitement est mis en œuvre pour produire ledit second signal, l’algorithme de traitement met en œuvre les étapes suivantes : échantillonner une première fois ledit premier signal sonore, filtrer ledit premier signal sonore de manière à laisser passer des hautes fréquences dudit premier signal sonore sans les atténuer, lesdites hautes fréquences étant préférentiellement prédéfinies comme étant supérieures à 50 Hz, et atténuer des basses fréquences relativement inférieures auxdites hautes fréquences, puis sous-échantillonner ledit premier signal sonore.
Lors du premier échantillonnage dudit premier signal sonore, la première fréquence d’échantillonnage est de préférence sensiblement égale à 44.1 kHz et sa résolution de quantification est de préférence sensiblement égale à 16 bits. Dans un mode de réalisation, l’atténuation desdites basses fréquences inférieures à 50 Hz est de 6 dB par octave. Dans un mode de réalisation, lors du sous-échantillonnage, la deuxième fréquence d’échantillonnage est sensiblement égale à 10 kHz.
Dans un mode de réalisation, consécutivement à l’étape de sous-échantillonnage dudit premier signal sonore, la méthode met en œuvre l’algorithme de Burg. Plus précisément, la méthode comporte les étapes suivantes : diviser ledit premier signal définissant un signal d’entrée d’un filtre sous-échantillonné en une pluralité de segments présentant une durée prédéterminée, analyser chaque segment pour fournir les coefficients d’un filtre prédicteur, lesdits coefficients dudit filtre prédicteur étant variables dans le temps, lesdits coefficients étant utilisés pour prédire une valeur du segment, déterminer la corrélation existante entre des segments consécutifs parmi ladite pluralité de segments de manière à déterminer Γ inintelligibilité du signal, déterminer l’erreur de la prédiction en comparant, pour chaque segment, la valeur prédite du segment et sa valeur mesurée en entrée du filtre, implémenter un filtrage en fonction de l’erreur de la prédiction et de la corrélation existante de manière à définir le second signal sonore inintelligible pour le destinataire.
Dans un mode de réalisation de l’invention, lors de l’étape d’implémentation du filtrage en fonction de l’erreur de la prédiction et de la corrélation existante, la méthode met en œuvre l’algorithme de Viterbi. Plus précisément, la méthode comprend une étape consistant à filtrer pour chaque segment au moins trois formants afin de définir un tracé formantique représentatif dudit deuxième signal. De préférence, la méthode met en œuvre une étape consistant à imposer une distance fréquentielle minimale entre deux formants. D’autres étapes peuvent être mises en œuvre afin d’améliorer le traitement acoustique dudit premier signal, en particulier la méthode peut : supprimer des variations rapides dues à la fréquence fondamentale, préférentiellement en filtrant le signal représentant la fréquence estimée de chaque formant au cours du temps de manière à laisser passer des basses fréquences dudit signal sans les atténuer, les basses fréquences étant prédéfinies comme étant inférieures à 20 Hz, éviter des discontinuités entre parties voisées et non-voisées du signal, préférentiellement en filtrant le signal représentant l’amplitude des formants de manière à laisser passer des basses fréquences dudit signal sans les atténuer, lesdites basses fréquences étant prédéfinies comme étant inférieurs à 50Hz,
Sur la figure 1, est illustrée une analyse temps-fréquence de signaux sonores utilisés dans l’expérience, sur une échelle de fréquence logarithmique, avec l’amplitude indiquée par la variation des niveaux de gris. Le premier signal sonore intelligible (représentée au milieu sur la figure 1) est traité pour ne filtrer que les fréquences et amplitudes de ses trois formants les plus saillants. Les trois estimations formants sont synthétisées par trois sons purs simultanés. Le deuxième signal sonore inintelligible est d’abord transmis (à gauche sur la figure 1). Ensuite, le premier signal sonore intelligible est transmis. Enfin, le deuxième signal sonore inintelligible est présenté de nouveau, à l’identique, à droite sur la figure 1 ; il devient parfaitement intelligible, provoquant un moment « Eurêka » pour le destinataire.
Dans la plupart des cas, les destinataires comprenaient parfaitement lors de la seconde transmission du second signal sonore dit inintelligible car difficilement compréhensible pour le destinataire de l’information transmise. L’hypothèse de l’étude était que ce changement rapide du deuxième signal inintelligible vers le premier signal sonore intelligible déclencherait un effet « Eurêka ». Cette hypothèse a été testée en mesurant les performances relatives aux capacités de restitution d’une information, contrastant des essais contenant la succession des étapes selon l’invention et des essais dits clairs dans lesquels un signal sonore intelligible est répétée une pluralité de fois. Il est notable que l’information intelligible est présentée trois fois plus dans les essais clairs, et que les destinataires de l’information ont en théorie plus de temps pour élaborer sur le sens à donner à l’information transmise. Si les essais de mise en œuvre de la méthode selon l’invention montrent que l’information transmise étaient néanmoins mieux enregistrée, conservée et restituée, ceci indiquerait une forte influence de l’ordonnancement et du traitement de l’information selon la mise en œuvre ici visée. Après chaque essai, un jugement de confiance a été collecté auprès des destinataires de l’information, en vue de vérifier s’ils pensaient ou non que la succession des étapes et le traitement acoustique visés par la présente invention pouvait influencer leurs capacités d’enregistrement, de conservation et de restitution de l’information.
METHODE
Auditeur
Afin de vérifier que la manière de transmettre et de traiter l’information impacte positivement les capacités d’enregistrement, de conservation et de restitution d’une information par un destinataire, onze destinataires (ou auditeurs) naïfs ont été recrutés. L’âge moyen des participants était 25,2 ans avec une déviation standard de 2,9 ans. Tous les participants étaient de langue maternelle française. Ils ne reportaient aucun problème audio logique, d’apprentissage du langage, ou neurologique.
Matériau verbal
Afin de mener cette étude, une base de 200 phrases courtes a été construite, en agrégeant le matériau de deux listes d’audiologie en Français (Hearing in noise test, HINT, et listes de Fournier, source: Collège National d’Audioprothèse, CDs Audiométrie vocale). Les versions intelligibles des phrases, dites versions en clair des phrases (sans bruit de fond), ont été utilisées. Dix phrases n’ont pas été utilisées car leur contenus sémantique était trop proche d’autres phrases de la base. Toutes les phrases étaient prononcées par un locuteur masculin. Des exemples sont fournis en Table 1.
Sine-wave speech
Chacune des 190 phrases utilisées ont été traitées en sine-wave speech, en utilisant la plateforme logicielle Praat (Boersma, 2001) et un script développé par C. Darwin (Darwin, 2003; Brungart et al., 2005). Les valeurs par défaut pour une estimation à 3 formants pour une voix masculine ont été utilisées. Brièvement, l’algorithme était le suivant. Les phrases en clair étaient échantillonnées à 44.1kHz avec une résolution de 16 bits. Elles étaient ensuite rehaussées (fréquence de coupure passe-haut de 50Hz et pente de 6 dB/octave) et ré-échantillonnées à 10 kHz. Ensuite, toutes les 10 ms, l’algorithme de Burg était utilisé pour estimer cinq pôles d’un filtre LPC (linear predictive-coding, Childers, 1978).Un algorithme de Viterbi était ensuite appliqué pour sélectionner, à chaque fenêtre d’analyse i.e. à chaque échantillon ayant dans ce cas une durée de 10 ms, les trois meilleurs candidats pour inclusion dans les tracés formantiques. L’algorithme minimisait i) les sauts en fréquences entre fenêtres d’analyse ; ii) la distance entre l’estimation et les valeurs de référence pour les positions fréquentielles de formants ; iii) il imposait une distance fréquentielle minimale entre formants. Le signal représentant la fréquence estimée de chaque formant au cours du temps était ensuite filtré passe-bas à 20 Hz, pour supprimer les variations rapides dues à la fréquence fondamentale. Le signal représentant l’amplitude des formants était lui filtré passe-bas à 50 Hz, pour éviter les discontinuités entre parties voisées et non-voisées de la parole. Les estimations résultantes de fréquence et d’amplitude étaient finalement utilisées pour générer trois sons purs simultanés, suivant ainsi l’évolution des 3 formats les plus saillants du matériau de parole.
Connus de l’homme du métier du traitement de la parole, l’algorithme de Burg minimise une distance de moindre carrée entre la prédiction d’un modèle auto-régressif et le signal d’entrée, et l’algorithme de Viterbi vise à proposer, pour une série d’observations temporelles provenant de plusieurs sources, la séquence d’événement la plus probable.
Procédure
Deux types d’essais étaient utilisés. Dans le premier type d’essais correspondant au signal CLR représenté sur la figure 2A, les conditions en clair (CLR) correspondant à un premier signal sonore intelligible, la même phrase était présentée successivement trois fois (le même premier signal sonore intelligible était donc présentée successivement trois fois), avec une pause d’approximativement 250 ms entre les répétitions. Dans le deuxième type d’essais correspondant au signal SWS (conditions sine-wave speech), une phrase correspondant au deuxième signal inintelligible était tout d’abord présentée sous la forme de son analogue sine-wave, puis la même phrase était présentée en clair (i.e présentée sous la forme du premier signal sonore intelligible), et enfin l’analogue sine-wave correspondant au deuxième signal inintelligible était présenté de nouveau (Fig. 1 and Fig. 2A). La pause entre répétition était toujours d’approximativement 250ms. Après chaque essai, les auditeurs devaient répondre s’ils pensaient avoir déjà entendu l’information dans un essai précédent, au cours de l’expérience. Cette première question était affichée sur l’écran d’un ordinateur et les auditeurs répondaient à l’aide d’une boîte à réponse spécifique. Ensuite, une deuxième question dite « confiance » était posée sur l’écran, demandant aux auditeurs s’ils étaient confiants ou non de leur réponse, en utilisant une échelle de 1 à 3 (confiance faible, moyenne, ou forte). Un quatrième choix était possible pour rapporter une erreur sur la tâche principale de mémoire. Les auditeurs répondaient par l’intermédiaire du clavier de l’ordinateur. Un total de 320 essais était présenté pour chaque auditeur (Fig. 2B). Parmi ces essais, 90 étaient des essais uniques, dans lesquels une information nouvelle était présentée. Un autre ensemble de 200 essais étaient des essais récurrents. Ces essais étaient d’abord présentés au début de l’expérience (100 essais, réponse correcte attendue « jamais entendu »), puis présentés une nouvelle fois à l’identique après 70 essais (100 essais, réponse correcte attendue « déjà entendu »). La moitié de ces essais récurrents était en condition CLR et l’autre moitié en condition SWS. Finalement, vu qu’un tel protocole introduirait une série initiale de 70 essais sans réponse correcte « déjà entendu », des répétitions aléatoires d’essais nominalement uniques étaient introduites au début de l’expérience. Ces essais ne sont pas inclus dans l’analyse des résultats. Résultats
Les réponses à la question mémoire ont, classiquement, été codées en quatre catégories : i) détections correctes, pour les essais où les auditeurs reportent correctement avoir déjà entendu l’information i.e. la phrase et qu’il s’agit bien d’un essai récurrent ; ii) fausse alarmes, pour les essais où les auditeurs reportent de façon erronée avoir déjà entendu l’information i.e. la phrase mais qu’il s’agit en fait d’un essai unique ; iii) ratés, pour les essais où les auditeurs ne rapportent pas avoir déjà entendu l’information alors qu’il s’agit d’un essai récurrent ; iv) réjections correctes, pour les essais où les auditeurs répondent correctement ne pas avoir déjà entendu l’information et qu’il s’agit d’un essai unique. Du fait que les détections correctes et ratées s’additionnent à 100%, de même que les fausses alarmes et les réjections correctes, sont reportées uniquement les détections correctes et fausses alarmes. La Figure 3A illustre les données individuelles pour les taux de détections correctes (Hits) et de fausses alarmes (FA), pour les 11 auditeurs, contrastées entre les conditions en clair (CLR) et les conditions sine-wave speech (SWS). Les taux de détection correcte étaient généralement élevés, et les taux de fausses alarmes généralement bas, indiquant que la plupart des sujets sont parvenus à de bonnes performances. Pour tous les auditeurs sauf un, les détections correctes étaient plus hautes pour la condition SWS comparée à la condition CLR.. De plus, les fausses alarmes étaient aussi plus basses pour la condition SWS. Ces deux observations indiquent une meilleure performance pour la condition SWS correspondant à la manière de transmettre et de traiter l’information par rapport à la condition CLR correspondant à la répétition du premier signal intelligible. Vu que les scores étaient parfois proches des valeurs plafond pour les détections correctes ou plancher pour les fausses alarmes, a été appliquée une transformation RAU aux données brutes (Rationalized— Arcsine Unit transform; Studebaker, 1985) avant d’analyser les tendances moyennées. Les valeurs moyennes en RAU sont illustrées en Figure 3B. De nouveau, l’analyse indique des taux de détection plus élevés (statistiques ici et dans le reste du document, t-test bilatéraux appariés, t(9) = 3.2373, p=0.0012 ; ) et des fausses alarmes moins nombreuses (t(9)= 4.6299, p=0.0012) pour les conditions SWS. Les statistiques utilisées sont un test t de Student, qui estime la probabilité p d’observer les données obtenus sous l’hypothèse nulle. Une valeur faible de p, par exemple sous le seuil de 0.01 (1% de chance), indique que les résultats ont moins de 1% de probabilité d’être dus au hasard. Ensuite, l’indice de sensibilité d'défini par la théorie de la détection du signal (Macmillan & Creelman, 2001) a été calculé. Cet indice combine les valeurs brutes de détections correctes (Hits) et de fausses alarmes (FA). Un indice d'élevé indique une bonne performance globale. Les résultats individuels et moyens pour cette nouvelle analyse sont illustrés en Figure 3C et 3D, respectivement. L’indice d'était plus élevé pour les conditions SWS comparées aux conditions CLR (t(9)= 4.6555, p=0.0012).
En résumé, les données brutes individuelles, les analyses RAU, et les analyses d’ convergent toutes pour indiquer un avantage significatif en terme d’amélioration des capacités d’enregistrement, de conservation et de restitution d’une information pour un destinataire comparées à une méthode mettant en œuvre une pluralité de répétition d’un même signal intelligible ne faisant pas l’objet d’un traitement afin de le rendre non-intelligible.
Les jugements de confiance ont été traités comme suit. Les essais pour lesquels les auditeurs indiquaient avoir fait une erreur sur la question de mémoire i.e. la question selon laquelle ils pensaient avoir déjà entendu l’information dans un essai précédent ou non, ont été recodés pour l’analyse de la tâche mémoire, mais omis de l’analyse de la tâche confiance. De telles erreurs n’étaient rapportées que très rarement (entre 0 et 4 erreurs rapportées par auditeur, soit 0.5% des essais en moyenne). Les jugements de confiance pour les autres essais ont été moyennés, en contrastant les conditions CLR et SWS ainsi que les réponses correctes ou incorrectes sur la tâche de mémoire (Fig.
4A). Les auditeurs étaient en général de moyennement à hautement confiants. Ils étaient plus confiants pour les essais où ils avaient répondu correctement sur la tâche mémoire, par rapport aux essais incorrects (l’analyse de variance (ANOVA) à mesures répétées, F(1,9) = 9.780, p = 0.003). L’ANOVA est une généralisation du test-t avec la même interprétation. Sont ici appelés « essais incorrects », les essais pour lesquels les auditeurs ont commis une erreur dans la tâche de mémorisation : soit ils ont dit avoir entendu déjà une phrase alors que ce n’était pas le cas (fausse alarme/FA), ou alors ils ont dit ne pas avoir entendu déjà une phrase alors que c’était le cas (raté/Miss). Ainsi, leurs jugements métacognitifs de confiance sur la tâche de mémoire étaient globalement appropriés. Par contre, et de façon importante, il n’y avait aucune différence entre les conditions SWS et CLR (F(l,9)=1.746, p=0.196), ni aucune interaction entre condition et réponse correcte (F(l,9)= 2.120, p=0.155). Ceci indique une déconnection complète entre la performance des participants, qui était objectivement meilleure pour les conditions SWS, et leur confiance dans leur jugement. En d’autres mots, les auditeurs n’étaient pas conscients du fait que les essais SWS incluant un moment « Eurêka » amélioraient les capacités d’enregistrement, de conservation et de restitution d’une information.

Claims (10)

  1. REVENDICATIONS
    1. Méthode pour transmettre une information dans un canal de communication reliant un transmetteur à un destinataire, la méthode comprenant les étapes successives suivantes : a) la détermination, par le transmetteur, d’un premier signal sonore intelligible représentatif de ladite information à transmettre, b) le traitement acoustique, par le transmetteur, dudit premier signal sonore afin de produire un second signal sonore inintelligible pour le destinataire, c) la transmission dudit second signal sonore du transmetteur vers le destinataire, d) la transmission dudit premier signal sonore du transmetteur vers le destinataire, ladite transmission dudit premier signal sonore étant déclenchée par ladite transmission dudit second signal sonore, e) la deuxième transmission dudit second signal sonore du transmetteur vers le destinataire, ladite deuxième transmission dudit second signal sonore étant déclenchée par ladite transmission dudit premier signal.
  2. 2. Méthode selon la revendication 1, dans laquelle les étapes d) et e) sont déclenchées après une durée prédéterminée, préférentiellement une durée sensiblement égale à 250 ms.
  3. 3. Méthode selon l’une quelconque des revendications précédentes, dans laquelle, durant l’étape de traitement, un algorithme de traitement est mis en œuvre pour produire ledit second signal, l’algorithme de traitement mettant en œuvre les étapes suivantes : échantillonner une première fois ledit premier signal sonore, filtrer ledit premier signal sonore de manière à laisser passer des hautes fréquences dudit premier signal sonore sans les atténuer, lesdites hautes fréquences étant préférentiellement prédéfinies comme étant supérieures à 50 Hz, et atténuer des basses fréquences relativement inférieures auxdites hautes fréquences, puis sous-échantillonner ledit premier signal sonore.
  4. 4. Méthode selon la revendication 3, dans laquelle, lors du premier échantillonnage dudit premier signal sonore, la première fréquence d’échantillonnage est sensiblement égale à 44.1 kHz.
  5. 5. Méthode selon l’une quelconque des revendications 3 ou 4, dans laquelle, lors du premier échantillonnage dudit premier signal sonore, la résolution de quantification est sensiblement égale à 16 bits.
  6. 6. Méthode selon l’une quelconque des revendications 3 à 5, dans laquelle, l’atténuation desdites basses fréquences inférieures à 50 Hz est de 6 dB par octave.
  7. 7. Méthode selon l’une quelconque des revendications 3 à 6, dans laquelle, lors du sous-échantillonnage, la deuxième fréquence d’échantillonnage est sensiblement égale à 10 kHz.
  8. 8. Méthode selon l’une quelconque des revendications précédentes comprenant des étapes consécutives à l’étape de sous-échantillonnage dudit premier signal sonore : diviser ledit premier signal définissant un signal d’entrée d’un filtre sous-échantillonné en une pluralité de segments présentant une durée prédéterminée, analyser chaque segment pour fournir les coefficients d’un filtre prédicteur, lesdits coefficients dudit filtre prédicteur étant variables dans le temps, lesdits coefficients étant utilisés pour prédire une valeur du segment, déterminer la corrélation existante entre des segments consécutifs parmi ladite pluralité de segments de manière à déterminer Γ inintelligibilité du signal, déterminer l’erreur de la prédiction en comparant, pour chaque segment, la valeur prédite du segment et sa valeur mesurée en entrée du filtre, implémenter un filtrage en fonction de l’erreur de la prédiction et de la corrélation existante de manière à définir le second signal sonore inintelligible pour le destinataire.
  9. 9. Méthode selon la revendication 8, comprenant une étape consistant, lors de l’étape d’implémentation du filtrage en fonction de l’erreur de la prédiction et de la corrélation existante, à filtrer pour chaque segment au moins trois formants afin de définir un tracé formantique représentatif dudit deuxième signal.
  10. 10. Méthode selon la revendication 9, comprenant une étape consistant à imposer une distance fréquentielle minimale entre deux formants.
FR1501497A 2015-07-15 2015-07-15 Methode pour transmettre une information a enregistrer Expired - Fee Related FR3039026B1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR1501497A FR3039026B1 (fr) 2015-07-15 2015-07-15 Methode pour transmettre une information a enregistrer
US15/744,939 US10673538B2 (en) 2015-07-15 2016-07-08 Method for transmitting an item of information to be recorded
PCT/EP2016/066369 WO2017009266A1 (fr) 2015-07-15 2016-07-08 Methode pour transmettre une information a enregistrer

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1501497 2015-07-15
FR1501497A FR3039026B1 (fr) 2015-07-15 2015-07-15 Methode pour transmettre une information a enregistrer

Publications (2)

Publication Number Publication Date
FR3039026A1 true FR3039026A1 (fr) 2017-01-20
FR3039026B1 FR3039026B1 (fr) 2018-07-20

Family

ID=55361525

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1501497A Expired - Fee Related FR3039026B1 (fr) 2015-07-15 2015-07-15 Methode pour transmettre une information a enregistrer

Country Status (3)

Country Link
US (1) US10673538B2 (fr)
FR (1) FR3039026B1 (fr)
WO (1) WO2017009266A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10673538B2 (en) * 2015-07-15 2020-06-02 Urgo Recherche Innovation Et Developpement Method for transmitting an item of information to be recorded

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5423073A (en) * 1991-09-30 1995-06-06 Fuji Xerox Co., Ltd. Acoustic signal transmitting system
FR2973611A1 (fr) * 2011-04-04 2012-10-05 Centre Nat Rech Scient Procede et dispositif de traitement d'un signal d'entree pour augmenter le rapport signal sur bruit et convertisseur correspondant

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8996370B2 (en) * 2012-01-31 2015-03-31 Microsoft Corporation Transferring data via audio link
US20130234824A1 (en) * 2012-03-10 2013-09-12 Sergiy Lozovsky Method, System and Program Product for Communicating Between Mobile Devices
WO2014028899A1 (fr) * 2012-08-16 2014-02-20 Alivecor, Inc. Transmission ultrasonore de signaux
US10050723B2 (en) * 2015-06-12 2018-08-14 Digital Kerosene Inc. Identity authentication using acoustic means
FR3039026B1 (fr) * 2015-07-15 2018-07-20 Centre National De La Recherche(C.N.R.S.) Methode pour transmettre une information a enregistrer
US9640061B1 (en) * 2015-12-31 2017-05-02 Google Inc. Remote alarm hushing with acoustic presence verification

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5423073A (en) * 1991-09-30 1995-06-06 Fuji Xerox Co., Ltd. Acoustic signal transmitting system
FR2973611A1 (fr) * 2011-04-04 2012-10-05 Centre Nat Rech Scient Procede et dispositif de traitement d'un signal d'entree pour augmenter le rapport signal sur bruit et convertisseur correspondant

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10673538B2 (en) * 2015-07-15 2020-06-02 Urgo Recherche Innovation Et Developpement Method for transmitting an item of information to be recorded

Also Published As

Publication number Publication date
FR3039026B1 (fr) 2018-07-20
US20180212688A1 (en) 2018-07-26
WO2017009266A1 (fr) 2017-01-19
US10673538B2 (en) 2020-06-02

Similar Documents

Publication Publication Date Title
Priyadarshani et al. Birdsong denoising using wavelets
Gabbay et al. Seeing through noise: Visually driven speaker separation and enhancement
EP2419900B1 (fr) Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal
EP1356461B1 (fr) Procede et dispositif de reduction de bruit
Triantafyllopoulos et al. Towards robust speech emotion recognition using deep residual networks for speech enhancement
EP2415047B1 (fr) Classification du bruit de fond contenu dans un signal sonore
EP0867856B1 (fr) "Méthode et dispositif de detection d'activité vocale"
Reiss A meta-analysis of high resolution audio perceptual evaluation
EP2136359B1 (fr) Procédé et appareil de mesure de l'intelligibilité d'un dispositif de diffusion sonore
EP2042000B1 (fr) Procede et dispositif de diagnostic de l'etat de fonctionnement d'un systeme de sonorisation
US8195453B2 (en) Distributed intelligibility testing system
US9058384B2 (en) System and method for identification of highly-variable vocalizations
EP1468416A1 (fr) Procede d'evaluation qualitative d'un signal audio numerique.
EP3078027B1 (fr) Procédé de détection de la voix
CA3123970A1 (fr) Mesure temporelle a haute precision d'evenements vibro-acoustiques en synchronisation avec un signal sonore sur dispositif a ecran tactile
FR3039026A1 (fr) Methode pour transmettre une information a enregistrer
EP3627510A1 (fr) Filtrage d'un signal sonore acquis par un systeme de reconnaissance vocale
KR20060029663A (ko) 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법
Zhang et al. Analysis of stress in speech using adaptive empirical mode decomposition
FR3112017A1 (fr) Equipement électronique comprenant un simulateur de distorsion
FR2951561A1 (fr) Procede de detection de la position d'un front d'onde correspondant a un evenement dans un signal recu par un detecteur
Taylor et al. Affective prosody in grunts of young chimpanzees
Santos A non-intrusive objective speech intelligibility metric tailored for cochlear implant users in complex listening environments
WO2023232609A1 (fr) Procédé et dispositif de vérification de l'utilisation d'une interface homme/machine par un opérateur humain
FR3111004A1 (fr) Procédé d’identification d’un locuteur

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20170120

PLFP Fee payment

Year of fee payment: 3

TQ Partial transmission of property

Owner name: UNIVERSITE PARIS DIDEROT - PARIS 7, FR

Effective date: 20170704

Owner name: ECOLE NORMALE SUPERIEURE, FR

Effective date: 20170704

Owner name: ECOLE SUPERIEURE DE PHYSIQUE ET DE CHIMIE INDU, FR

Effective date: 20170704

Owner name: URGO RECHERCHE INNOVATION ET DEVELOPPEMENT, FR

Effective date: 20170704

Owner name: CENTRE NATIONAL DE LA RECHERCHE(C.N.R.S.), FR

Effective date: 20170704

TQ Partial transmission of property

Owner name: URGO RECHERCHE INNOVATION ET DEVELOPPEMENT, FR

Effective date: 20170704

Owner name: ECOLE SUPERIEURE DE PHYSIQUE ET DE CHIMIE INDU, FR

Effective date: 20170704

Owner name: UNIVERSITE PARIS DIDEROT - PARIS 7, FR

Effective date: 20170704

Owner name: CENTRE NATIONAL DE LA RECHERCHE(C.N.R.S.), FR

Effective date: 20170704

Owner name: ECOLE NORMALE SUPERIEURE, FR

Effective date: 20170704

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7

CD Change of name or company name

Owner name: URGO RECHERCHE INNOVATION ET DEVELOPPEMENT, FR

Effective date: 20221006

Owner name: UNIVERSITE PARIS CITE, FR

Effective date: 20221006

Owner name: ECOLE SUPERIEURE DE PHYSIQUE ET DE CHIMIE INDU, FR

Effective date: 20221006

Owner name: ECOLE NORMALE SUPERIEURE, FR

Effective date: 20221006

Owner name: CENTRE NATIONAL DE LA RECHERCHE(C.N.R.S.), FR

Effective date: 20221006

ST Notification of lapse

Effective date: 20230305