WO2006097633A1

WO2006097633A1 - Procede et systeme de spatialisation d'un signal sonore en fonction des qualites intrinseques de ce dernier

Info

Publication number: WO2006097633A1
Application number: PCT/FR2006/000580
Authority: WO
Inventors: Jean-Philippe Thomas; Delphine Charlet; Mikaël COLLET
Original assignee: France Telecom
Priority date: 2005-03-15
Filing date: 2006-03-15
Publication date: 2006-09-21
Also published as: EP1869949A1

Abstract

L'invention concerne un procédé et un système de spatialisation d'un signal sonore (SS). On subdivise (A) le signal sonore en trames successives (TSSi), on analyse (B) les trames par blocs de trames pour déterminer au moins un paramètre spectral et/ou physiologique (Pspj) dans chaque trame, on affecte (C) à chaque trame un index (j,k) représentatif de ce paramètre pour engendrer une suite de trames classifïées et on soumet (D) chaque trame (F) affectée d'un même index (j,k), à un traitement de spatiaiisation (Sj,k). Application au traitement de spatialisation de signaux monophoniques, stéréophoniques, de parole, téléphoniques ou autres.

Description

PROCEDE ET SYSTEME DE SPATIALISATIQN D'UN SIGNAL SONORE EN FONCTION DES QUALITES INTRINSEQUES DE CE DERNIER

A l'heure actuelle, la quasi-totalité des échanges sonores sont monophoniques. Les échanges sonores concernent essentiellement l'émission et la réception de signaux sonores, directement perceptibles par l'oreille humaine. Parmi ceux-ci, on peut citer les signaux sonores fournis par la radio, le téléphone, la messagerie, la télévision ou autres.

Parmi les qualités reconnues à un signal sonore, celle relative au relief ou au rendu spatial de ce dernier est la plus recherchée. Pour spatialiser un signal ou contenu sonore, les techniques actuelles consistent, soit à effectuer une prise de son spatialisée, en studio, soit à effectuer un traitement hors temps réel et manuel en studio, notamment pour la spatialisation des bandes sonores du cinéma.

Pour ce qui concerne la prise de son spatialisée, ces procédés, basés sur une approche physique, consistent, en général, à reproduire le champ sonore à l'identique du champ acoustique d'origine au sein d'une zone de dimensions finies. Grâce à ces procédés, l'auditeur est plongé dans un champ identique en tout point à celui qu'il aurait perçu en présence des sources réelles et ce dernier est donc capable de localiser les sources sonores comme en situation d'écoute réelle. Pour une description plus détaillée de ce type de technique, en particulier d'holophonie, on pourra se reporter aux travaux intitulés "Restitution sonore spatialisée sur une zone étendue : Application à la téléprésence" R. Nicol ; thèse de l'Université du Maine, 1999.

Un autre exemple de reconstruction physique du champ acoustique est connu sous le nom de technique ambiophonique, "ambisonic" en anglais, laquelle utilise une décomposition du champ sonore sur une base de fonctions propres appelées "harmoniques sphériques".

La technique connue de la stéréophonie, quant à elle, exploite les différences de temps de propagation ou d'intensité sonore pour positionner les sources sonores entre deux ou plusieurs haut-parleurs, à partir des différences interaurales de temps et d'intensité qui définissent les critères perceptifs de localisation auditive dans un plan sensiblement horizontal.

Les techniques binaurales, enfin, ont pour objet de reconstruire le champ acoustique uniquement au voisinage des oreilles de l'auditeur, de façon que les tympans de ce dernier perçoivent un champ acoustique sensiblement identique à celui qui aurait été engendré par des sources réelles.

La présente invention a pour objet de remédier aux inconvénients des techniques de l'art antérieur, afin de permettre l'application la plus large des techniques de spatialisation à tout signal sonore monophonique et/ou stéréophonique, ou même à un signal sonore plus complexe.

En particulier, la présente invention a pour objet un procédé de spatialisation d'un signal sonore remarquable en ce qu'il consiste au moins à subdiviser ce signal sonore en trames successives, analyser les trames du signal sonore par blocs de trames pour déterminer au moins un paramètre spectral et/ou physiologique de ce signal sonore dans chaque trame, affecter à chaque trame un index représentatif d'au moins ce paramètre spectral et/ou physiologique, pour engendrer une suite de trames classifiées et soumettre chaque trame ou groupe de trames classifiées, affectées d'un même index, à un traitement de spatialisation, fonction de la valeur de cet index affecté à chaque trame.

La présente invention a en outre pour objet un système de spatialisation d'un signal sonore remarquable en ce qu'il comporte au moins, en combinaison, un module d'analyse de ce signal sonore en trames successives, pour déterminer et affecter à chaque trame successive un index représentatif d'au moins un paramètre spectral et/ou physiologique dudit signal sonore dans chaque trame, pour engendrer une suite d'index de trames classifiées et un module de traitement de chaque trame ou groupe de trames du signal sonore, classifiées et affectées d'un même index, selon un traitement de spatialisation, fonction de la valeur de l'index affecté. L'invention trouve application à l'industrie de l'électronique de traitement des signaux sonores, en particulier de signaux stéréo- ou mono-phoniques, à l'enregistrement de phonogrammes et/ou de vidéogrammes, à l'industrie de la téléphonie fixe ou mobile, à la communication vocale et/ou à la transmission de signaux de parole sur le réseau IP. Elle sera mieux comprise à la lecture de la description et à l'observation des dessins ci-après dans lesquels :

- la figure la représente, à titre purement illustratif, un organigramme des étapes essentielles de mise en œuvre du procédé objet de la présente invention ; - la figure Ib représente, à titre purement illustratif, un mode de classification de trames acoustiques selon des classes acoustiques, conformément à un aspect remarquable du procédé, objet de la présente invention ;

- les figures 2a et 2b représentent, à titre illustratif, une variante non limitative de mise en œuvre du procédé objet de la présente invention appliqué en mode différé, soit à l'enregistrement et la restitution, soit à la diffusion hors ligne partiel, ou encore à la communication en ligne en temps réel de phonogrammes et/ou à la partie sonore de vidéogrammes, conformément au procédé objet de la présente invention ;

- la figure 3 a représente à titre illustratif, un système de spatialisation d'un signal sonore, conforme à l'objet de la présente invention, opérant en mode diffusion hors ligne partiel ;

- la figure 3b représente à titre illustratif un système de spatialisation d'un signal sonore en mode communication en ligne, plus particulièrement destiné à des appareils du type combiné téléphonique ou autre.

Une description plus détaillée du procédé de spatialisation d'un signal sonore en fonction des qualités intrinsèques de ce signal, conforme à l'objet de la présente invention, sera maintenant donnée en liaison avec la figure la et la figure Ib.

En référence à la figure la, on indique que le procédé objet de l'invention est mis en œuvre sur un signal sonore SS, ce Signal Sonore correspondant par exemple à un signal numérique, audionumérique, de parole ou de téléphonie par exemple. Le procédé objet de l'invention consiste, en premier lieu, en une étape A à subdiviser le signal sonore SS en trames successives. L'opération de subdivision est notée

SS → [TSSiJ .

L'étape de subdivision précitée peut être exécutée de manière classique en subdivisant le signal en trames successives de durée comprise entre 10 à 20 millisecondes, par exemple, typiquement 16 millisecondes. Un échantillonnage du signal sonore est ainsi effectué pour obtenir une succession de trames jointives par exemple, i désignant le rang de la trame. Les valeurs typiques sont des trames d'une durée de 32 millisecondes, calculées toutes les 16 millisecondes, donc avec un recouvrement de 16 millisecondes. L'étape A est suivie d'une étape B consistant à analyser un bloc de trames du signal sonore TSS, pour déterminer au moins un paramètre spectral et/ou physiologique du signal sonore dans chaque trame.

L'opération de l'étape B consistant à analyser chaque trame est représentée par la relation

où [TSSi +

désigne le bloc de trames et

[PspjJo désigne un ensemble de paramètres spectraux et/ou physiologiques issus de l'analyse.

Par paramètre spectral et/ou physiologique du signal sonore, on indique que ce ou ces paramètres peuvent correspondre par exemple à un paramètre de fréquence pour un signal musical, un formant pour un signal de parole ou autre, ainsi qu'il sera décrit ultérieurement dans la description. On comprend en particulier que plusieurs paramètres significatifs peuvent être associés à chaque trame en particulier lorsque le signal sonore

SS correspond à un signal comportant à la fois de la musique et des paroles de chant par exemple, ou dans d'autres situations. Le nombre de paramètres spectral et/ou physiologique affecté à chaque trame n'est pas limitatif, ainsi qu'il sera décrit ultérieurement dans la description.

L'étape B est alors suivie d'une étape C consistant à affecter à chaque trame TSSj un index représentatif d'au moins un paramètre spectral ou physiologique pour engendrer une suite de trames classifiées.

Sur la figure la, l'étape C d'affectation d'un index est représentée par la relation symbolique

[PspJo -> TSSio.k) . L'opération B d'analyse de trames et C d'affectation d'index travaillent sur un . bloc de trames i-K_avant, i+K_après. Cette définition du bloc est générique et le mode en ligne se résume à K_après =0.

D'une manière générale, et conformément à un aspect remarquable du procédé, objet de la présente invention, la notion d'index affecté à chaque trame correspond par exemple à un index j affecté d'un sous-index k, le sous-index k permettant, par exemple, de préciser des variantes de classification pour la classification principale j affectée à chaque trame.

L'étape C permet ainsi d'obtenir une classification fine de chaque trame en fonction du ou des paramètres spectral et/ou physiologique du signal sonore SS dans la trame considérée TSSi.

L'étape C est alors suivie d'une étape D de spatialisation proprement dite, cette étape consistant à soumettre chaque trame ou groupe de trame classifiée affecté d'un même index et noté

à un même traitement de spatialisation fonction de la valeur de l'index précité affectée à la trame considérée.

A l'étape B de la figure la l'opération de spatialisation est notée par la relation symbolique

Sj, k(TSSio. k)). I

Dans la relation précédente, on indique que S_j,_k(.) indique le traitement de spatialisation spécifique appliqué à toute trame de rang i à laquelle a été affecté l'index j,k ou à tout groupe de trame correspondant. On comprend en particulier que pour une durée de trame typiquement égale à 16 millisecondes par exemple, une succession de trames peut bien entendu être affectée du même index j,k.

Bien entendu, l'étape D de la figure la est suivie d'une étape E consistant à comparer la valeur du rang i de la trame considérée TSSj à une valeur maximale I de la décomposition ou subdivision en trames.

Sur réponse négative au test de l'étape E, le rang de la trame considérée i est incrémenté à la valeur i+1 à l'étape F pour retourner à l'étape A et poursuivre le processus tant qu'il existe une trame non soumise au processus de subdivision de l'étape A pour assurer le traitement complet du signal sonore SS. D'une manière plus spécifique on indique que le procédé objet de l'invention en référence à la figure Ib consiste à classifier chaque trame ou groupe de trames selon une pluralité de classes acoustiques notées C_j.

En référence à la figure précitée, chaque classe acoustique C_j telle que Musique, Parole/Type de locuteur, Brouhaha, ou Silence par exemple, peut être associée à une valeur d'index j prenant la valeur 0, 1, 2, 3 correspondante pour les classes acoustiques précitées de manière non limitative.

En outre, une valeur de sous-index k peut être associée à la valeur d'index j ainsi que représenté en figure Ib pour la musique, k pouvant prendre, avec la valeur j=0, les valeurs 1, 2 ou 3 par exemple, pour musique classique, musique d'ambiance ou autre par exemple.

- la classe acoustique Parole/Type de locuteur peut être associée à la valeur d'index j=l et aux valeurs de sous-index 2, 3, 4, les valeurs de sous-index précitées pouvant permettre par exemple avantageusement de discriminer le locuteur ; - la classe acoustique Brouhaha peut être associée à la valeur d'index j=2 des valeurs de sous-index 2, 4 et 5 par exemple, pouvant correspondre à différents environnements tels que brouhaha urbain, industriels ou autres par exemple ;

— la classe acoustique de Silence peut être associée à la valeur d'index j=3, des valeurs de sous-index 4, 5 et 6 par exemple pouvant avantageusement être prévues pour correspondre soit à un silence absolu, soit à des bruits spécifiques tels que craquements, grincements ou autres, lesquels peuvent témoigner de différentes ambiances de silence par exemple.

D'une manière générale, on rappelle que la valeur de l'index j, 0, 1, 2 ou 3 est une valeur obtenue par analyse à partir des paramètres spectraux et/ou physiologiques du signal sonore SS dans chaque trame et que la valeur de sous-index k associée à chaque valeur d'index peut être une valeur arbitraire ou correspondant à une qualité particulière du signal sonore.

En ce qui concerne, de manière plus spécifique la classe acoustique relative à la

Parole/Type de locuteur, pour Cj=I, on indique que l'exécution de la classification de chaque trame ou groupe de trames par type de locuteur, c'est-à-dire choix du locuteur 2, 3 ou 4 lorsque le signal de parole correspondant à Cj=I est détecté, consiste à discriminer le changement de locuteur parmi une pluralité quelconque de locuteurs dans le signal sonore par exemple. La technique mise en œuvre pour traiter des documents a priori inconnus est la suivante : - on détecte un changement de locuteur (rupture dans le signal d'un indice particulier) ;

- le locuteur après changement est comparé à l'ensemble des locuteurs déjà identifiés dans le document et il est soit reconnu comme l'un d'eux, soit considéré comme un nouveau locuteur et vient donc augmenter la taille du "dictionnaire de références" des locuteurs pour ce document ou signal sonore.

Pour une description plus détaillée d'un mode opératoire permettant de discriminer le type de locuteur, dans un signal de parole ou un signal audio comportant un signal de parole, on pourra utilement se reporter à la publication intitulée "Segmentation et indexation par locuteurs d'un document audio" publiée par Perrine Delacourt, Institut EURECOM, 2229 route de Crêtes, 0.6904 Sophia Antipolis, France et éditée par RJC en 1999.

En ce qui concerne l'opération de spatialisation exécutée à l'étape D pour chacune des trames successives classifiées on indique que le processus de spatialisation appliqué à chaque trame classifiée peut être choisi parmi une pluralité de traitements de spatialisation tels que la réverbération, l'atténuation, le changement de fréquence fondamentale, la coloration par filtrage harmonique, le retard par exemple ou encore les techniques d'holophonie, de stéréophonie, binaurales ou autres. On comprend en effet que pour toute valeur d'index j et de sous-index k affectée à chaque trame TSSj ou groupe de trames peut ainsi être choisi, en fonction de la valeur d'index et de sous index précitées un traitement de spatialisation spécifique et en particulier le traitement le mieux adapté en fonction de l'effet recherché.

A titre d'exemple non limitatif, lors d'une opération de spatialisation d'un signal de parole et en particulier pour une discrimination par type de locuteur, on indique que le traitement peut consister à appliquer un effet dit "fun" par changement du timbre de la voix, par exemple, pour un ou plusieurs locuteurs du signal sonore SS. On comprend ainsi que le procédé objet de l'invention permet d'effectuer des rendus sonores différenciés selon les valeurs d'index précitées et en particulier des classes acoustiques C_j définies précédemment dans la description.

Le procédé objet de l'invention permet ainsi d'appliquer automatiquement des rendus sonores ou des positions sonores différenciés sur des documents sonores quelconques qui se traduisent par des signaux sonores SS pour lesquels on ne dispose d'aucune information annexe ou pour lesquels on ne contrôle pas la prise de son.

Selon un aspect particulièrement remarquable du procédé objet de l'invention, ce dernier permet en outre de réduire la charge ou le débit des réseaux ou le spectre des ondes radio, car, alors que la transmission du signal sonore SS peut être effectuée sur un signal monophonique par exemple, il. est alors tout à fait envisageable d'exécuter le processus de spatialisation à la réception de ce signal et donc après transmission a minima du point de vue charge ou débit du réseau de transmission.

Différentes variantes de mise en œuvre du procédé objet de la présente invention seront maintenant décrites en liaison avec la figure 2a et 2b.

En référence à la figure 2a, on indique que le procédé objet de l'invention peut avantageusement être exécuté en mode hors ligne en temps différé.

Dans cette situation, il consiste au moins à exécuter les opérations A de subdivision en trames B d'analyse des trames et d'affectation d'index pour engendrer une suite de trames classifiées, puis à effectuer un enregistrement sur un support d'enregistrement d'au moins la suite d'index affectée au signal sonore subdivisé en trames et du signal sonore SS ou des trames successives représentatives de ce dernier.

Sur la figure 2a, les étapes A, B représentent les mêmes étapes que celles portant la même référence à la figure la. L'étape d'affectation d'index peut alors être subdivisée en une étape Co correspondant à choisir les index j et sous-index k correspondants, affectés à chaque trame TSSj, l'étape Co étant suivie d'une étape C₁ consistant à comparer le rang de la trame i à la valeur I finale représentative du nombre de trames. Sur réponse négative au test C₁, le rang de la trame est incrémentée par la relation i=i+l à l'étape C₂ pour un retour à l'analyse des trames à l'étape B et poursuite du processus tant que el rang de la trame n'a pas atteint la valeur I. Au contraire, sur réponse positive au test de l'étape Ci, on procède alors à un enregistrement C₃ de l'ensemble des trames notées [TSSiJ, et d'une suite d'index notée

La notion d'enregistrement exécuté à l'étape C₃ s'entend d'un enregistrement sur tout support de mémorisation tel que par exemple, une mémoire non volatile, une mémoire permanente, un disque optique d'enregistrement de type CD ou DVD par exemple.

La mise en œuvre en mode hors ligne en temps différé du procédé objet de l'invention consiste alors, ainsi que représenté en figure 2b à partir de l'enregistrement dont on dispose, obtenu à l'étape C₃, à lire le support d'enregistrement correspondant, comportant au moins la suite d'index affectée au. signal sonore subdivisé en trames et le signal sonore ou en tout cas la suite de trames représentatives de ce dernier en une étape Do représentée sur la figure 2b.

L'étape de lecture D₀ est alors suivie d'une étape D₁ consistant à appliquer au signal sonore et à chaque trame courante de ce signal sonore, un traitement de spatialisation fonction de l'index affecté à la trame courante du signal sonore selon la relation symbolique de l'étape D de la figure la.

On procède ainsi à la restitution du signal sonore spatialisé conformément au procédé objet de la présente invention. L'étape de spatialisation et de restitution Di est alors suivie d'une étape de test D₂ consistant à comparer la valeur du rang de la trame i à la valeur maximale I. Sur réponse négative au test D₂, l'on procède à l'incrémentation du rang de trame i=i+l et à un retour à la lecture à l'étape Do de la trame suivante tant que la valeur I du rang de trame n'est pas atteinte. Le procédé objet de la présente invention peut également être mis en œuvre en mode diffusion hors ligne en décalage temporel restreint, n'excédant pas la durée d'un nombre de quelques trames, par analyse et classification de chaque trame successive et traitement de spatialisation successif de chaque trame en fonction de l'index affecté.

Dans cette situation, on comprend, par exemple, que l'opération d'enregistrement telle que décrite en liaison avec la figure 2a à l'étape C3 peut être lancée. La mémorisation intervenant par exemple sur une mémoire électronique adressable et l'opération de lecture et de spatialisation pour restitution du signal sonore spatialisé représenté en figure 2b pouvant intervenir après obtention de quelques trames par lecture décalée de la mémoire électronique précitée, la lecture intervenant de manière synchrone mais décalée d'une durée de quelques trames par exemple.

Typiquement, quel que soit le système de rendu sonore, le système s'adapte à l'enregistrement.

En outre, le procédé objet de la présente invention, tel qu'illustré selon la mise en œuvre des figures 2a et 2b peut être exécuté en mode communication en ligne en décalage temporel minimum, n'excédant pas la durée d'une trame, par analyse et classification et traitement de spatialisation de chaque trame du signal sonore retardé au maximum d'une durée de trame.

Dans cette situation, on comprend également que les opérations des figures 2a et 2b peuvent être exécutées avec mémorisation dans une mémoire telle qu'une mémoire vive par exemple, le décalage temporel pouvant être réduit au temps de calcul de l'opération d'analyse de trame et d'affectation d'index pour une trame courante, c'est-à-dire les étape B et Co de la figure 2a, ce temps de calcul pouvant bien entendu, être rendu très inférieur à la durée d'une trame. Le mode opératoire précité pour une exécution en mode communication en ligne du procédé objet de la présente invention peut avantageusement être utilisé pour un traitement de spatialisation d'une communication téléphonique par exemple, sur un signal de parole transmis sur un réseau de téléphonie fixe ou mobile par exemple. Il peut également être mis en œuvre en mode de communication en ligne pour la transmission d'un signal de parole en réseau IP -par exemple.

Une description plus détaillée d'un système de spatialisation d'un signal sonore conforme à l'objet de la présente invention sera maintenant donnée en liaison avec les figures 3a et 3b.

D'une manière générale, en référence aux figures précitées, le système objet de l'invention comporte au moins en combinaison un module 1 d'analyse du signal sonore en trames successives pour déterminer et affecter à chaque trame successive un index représentatif d'au moins un paramètre spectral et/ou physiologique du signal sonore dans chaque trame pour engendrer ainsi une suite d'index de trames classifïées. Sur les figures 3 a et 3b, la suite d'index de trames classifiées est représentée par la relation

En référence aux figures 3a et 3b précitées, le système objet de l'invention comporte en outre un module 2 de traitement de chaque trame ou groupe de trames du signal sonore SS et en particulier des trames classifiées et affectées d'un même index selon un même traitement de spatialisation, fonction de la valeur de l'index affecté et, ainsi que décrit précédemment dans la description, du sous-index k associé à toute valeur d'index j représentative d'une classe acoustique. En référence aux figures 3a et 3b, on indique que le module de traitement par spatialisation 2 est en mesure, à partir de la suite d'index de trames classifiées précitées et, bien entendu, de la suite des trames dont il dispose, d'appliquer le traitement de spatialisation et de restituer le signal sonore spatialisé sur un ensemble de hauts parleurs notés HP sur les figures 3 a et 3b. De manière plus spécifique, en référence à la figure 3 a, on indique que pour un traitement du signal sonore SS en mode diffusion, c'est-à-dire hors ligne partiel, le module d'analyse 1 et le module 2 de traitement par spatialisation sont connectés en cascade. Dans cette situation, le module d'analyse 1 délivre au module 2 de traitement de spatialisation un signal représentatif de la suite d'index ainsi qu'indiqué précédemment, ainsi que soit le signal sonore SS, soit la suite de trames [TSSi]J décalé(e) temporeïlement d'une durée sensiblement égale à une pluralité de durée de trames au module 2 de traitement par spatialisation.

Au contraire, ainsi que représenté en figure 3b, pour un traitement du signal sonore SS en mode communication en ligne, le module 1 d'analyse et le module 2 de traitement sont connectés sensiblement en parallèle ainsi que représenté sur la figure précitée, pour exécuter chacun une subdivision en trames en parallèle du signal sonore.

Dans cette situation, le module 1 d'analyse et le modèle 2 de traitement de spatialisation peuvent avantageusement comporter chacun un module de subdivision en trames, portant la référence Io respectivement 2₀, lesquels sont synchronisés par un signal de synchronisation S_y échangés par exemple entre le module 1 d'analyse et le module 2 de traitement par spatialisation.

Dans le cas de la figure 3b, de même que dans le cas de la figure 3a, le module 1 d'analyse comporte en outre un module 1₁ exécutant les opérations B et C de la figure la, c'est-à-dire permettant l'analyse des trames et l'affectation d'index pour engendrer la suite de trames classifiées et, en particulier, la suite d'index précédemment décrite.

Le module 2 de traitement de spatialisation comporte un module de traitement assurant l'opération de spatialisation proprement dite sur la série de trames classifiées.

Dans le cas de la figure 3b, on indique que le traitement de module 1 d'analyse et, en particulier, le module I₁ de ce dernier peut être très inférieur à celui d'une durée de trame, ce qui permet d'assurer un mode opératoire du système représenté en figure 3b avec un temps de traitement très inférieur à une durée de trame. Le système correspondant apparaît alors particulièrement bien adapté à un traitement du signal sonore SS en mode communication en ligne dans les conditions indiquées précédemment dans la description. Bien entendu, le procédé objet de la présente invention et le système correspondant tel que décrit en figures 3 a et 3b peuvent être mis en œuvre à partir de modules logiciels correspondants et en particulier d'un programme enregistré sur un support de mémorisation et exécuté par un ordinateur.

C'est en particulier en ce qui concerne les modules Io du module 1 d'analyse représenté en figure 3a ou 3b, ce module permettant d'exécuter la subdivision en trames ainsi que de modules logiciels permettant l'analyse de chaque trame successive du signal sonore pour déterminer au moins un paramètre spectral et/ou physiologique du signal sonore dans chaque trame, puis d'affecter à chaque trame l'index représentatif du paramètre spectral et/ou physiologique pour engendrer une suite de trames classifiées, c'est-à-dire le signal correspondant à la suite d'index précédemment décrit dans la description. Ces opérations sont exécutées par un module logiciel I₁ implanté sur le module 1 d'analyse représenté en figure 3a ou 3b.

Il en est de même pour ce qui concerne le module de spatialisation 2_\, lequel permet d'exécuter et soumettre chaque trame au groupe de trames classifiées affectées d'un même index à un traitement de spatialisation en fonction de la valeur de l'index affecté à chaque trame.

Pour ce qui concerne le mode de mise en œuvre du procédé objet de l'invention, représenté en figure , 2a ou 2b, on indique, en particulier, que le procédé objet de l'invention peut être mis en œuvre sous forme totalement logicielle, en particulier pour le traitement de spatialisation de signaux sonores transmis en liaison avec des pages html.

Dans ce cas, le mode opératoire est celui représenté en figure la.. Le signal sonore SS est alors soumis successivement aux étapes A, B, C, D et E de la figure précitée sur un terminal à partir d'un signal sonore SS transmis par intermédiaire de paquets IP sans aucun traitement préalable exécuté au niveau du serveur transmettant les pages html correspondantes. Dans ce cas, le mode opératoire correspond à un traitement en ligne avec un retard de traitement correspondant au plus à une durée de trame.

Claims

REVENDICATIONS

1. Procédé de spatialisation d'un signal sonore, caractérisé en ce qu'il consiste au moins à : - subdiviser ledit signal sonore en trames successives ; analyser les trames dudit signal sonore par blocs de trames pour déterminer au moins un paramètre spectral et/ou physiologique dudit signal sonore dans chaque trame ; affecter à chaque trame un index représentatif dudit au moins un paramètre spectral et/ou physiologique, pour engendrer une suite de trames classifîées ; soumettre chaque trame, ou groupe de trames, classifiées, affectée d'un même index, à un traitement de spatialisation, fonction de la valeur dudit index affecté à chaque trame.

2. Procédé selon la revendication 1, caractérisé en ce que celui-ci consiste à classifier chaque trame ou groupe de trames selon une pluralité de classes acoustiques, chacune associée à un index représentatif d'au moins un signal sonore de musique, parole, type de locuteur, brouhaha, silence.

3. Procédé selon la revendication 2, caractérisé en ce que, pour une classification de chaque trame ou groupe de trames par type de locuteur, celui-ci consiste à discriminer le changement de locuteur parmi une pluralité quelconque de locuteurs dans ledit signal sonore.

4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce que ledit même traitement de spatialisation distinct est choisi parmi une pluralité de traitements de spatialisation tels que la réverbération, l'atténuation, le changement de fréquence fondamentale, la coloration par filtrage harmonique, le retard, ou encore les techniques d'holophonie, de stéréophonie, les techniques binaurales.

5. Procédé selon l'une des revendications précédentes, caractérisé en ce que celui-ci est exécuté en mode hors ligne en temps différé, ledit procédé consistant au moins, suite aux étapes d'analyse et d'affectation d'index pour engendrer une suite de trames classifiées, à enregistrer sur un support d'enregistrement au moins la suite d'index affectés au signal sonore subdivisé en trames et ledit signal sonore.

6. Procédé selon la revendication 5, caractérisé en ce que celui-ci est exécuté en mode hors ligne en temps différé, ledit procédé consistant au moins à : - lire un support d'enregistrement comportant au moins ladite suite d'index affectée au signal sonore subdivisé en trames et ledit signal sonore ; appliquer audit signal sonore et à chaque trame courante de ce signal sonore un traitement de spatialisation, fonction de l'index affecté à la trame courante dudit signal sonore.

7. Procédé selon l'une des revendications 1 à 4, caractérisé en ce que celui-ci est exécuté en mode diffusion hors ligne partiel en décalage temporel restreint, n'excédant pas la durée d'un nombre de quelques trames par analyse et classification de chaque trame successive et traitement de spatialisation successif de chaque trame en fonction de l'index affecté.

8. Procédé selon l'une des revendications 1 à 4, caractérisé en ce que celui-ci est exécuté en mode communication en ligne, en décalage temporel minimum n'excédant pas la durée d'une trame, par analyse, classification et traitement de spatialisation de chaque trame du signal sonore retardé au maximum d'une durée de trame.

9. Système de spatialisation d'un signal sonore, caractérisé en ce qu'il comporte au moins, en combinaison : des moyens d'analyse dudit signal sonore en trames successives, pour déterminer et affecter à chaque trame successive un index représentatif d'au moins un paramètre spectral et/ou physiologique dudit signal sonore dans chaque trame, pour engendrer une suite d'index de trames classifiées ; - des moyens de traitement de chaque trame, ou groupe de trames, du signal sonore, classifiées et affectées d'un, même index selon un traitement de spatialisation, fonction de la valeur dudit index affecté.

10. Système selon la revendication 9, caractérisé en ce que, pour un traitement dudit signal sonore en mode diffusion, hors ligne partiel, lesdits moyens d'analyse et lesdits moyens de traitement sont connectés en cascade, lesdits moyens d'analyse délivrant auxdits moyens de traitement un signal représentatif d'une suite d'index et un signal sonore décalés temporellement d'une durée sensiblement égale à une pluralité de durées de trame auxdits moyens de traitement par spatialisation.

11. Système selon la revendication 9, caractérisé en ce que, pour un traitement dudit signal sonore en mode communication en ligne, lesdits moyens d'analyse et lesdits moyens de traitement sont connectés en parallèle pour exécuter chacun une subdivision en trames en parallèle dudit signal sonore, lesdits moyens d'analyse délivrant auxdits moyens de traitement une suite d'index de trames classifiées, lesdits moyens de traitement procédant à un traitement de spatialisation de chaque trame, fonction de la valeur dudit index affecté à chaque trame avec un décalage temporel sur le signal sonore n'excédant pas une durée de trame.

12. Enregistrement sur un support d'enregistrement d'un signal sonore, caractérisé en ce que, outre un signal sonore enregistré sous forme d'un ensemble de trames, celui-ci comporte une suite d'index, chaque index étant représentatif d'au moins un paramètre spectral et/ou physiologique dudit signal sonore dans une trame.

13. Produit de programme enregistré sur un support de mémorisation pour exécution par un ordinateur, caractérisé en ce que, lors de l'exécution par un ordinateur, celui-ci permet au moins de : subdiviser un signal sonore en trames successives ; - analyser chaque trame successive dudit signal sonore pour déterminer au moins un paramètre spectral et/ou physiologique dudit signal sonore, dans chaque trame ; affecter à chaque trame un index représentatif dudit au moins un paramètre spectral et/ou physiologique, pour engendrer une suite de trames classifiées ; - soumettre chaque trame, ou groupe de trames, classifiée, affectée d'un même index, à un même traitement de spatialisation, fonction de la valeur dudit index affecté à chaque trame.