FR3002406A1

FR3002406A1 - Procede et dispositif de generation de signaux d'alimentation destines a un systeme de restitution sonore

Info

Publication number: FR3002406A1
Application number: FR1351352A
Authority: FR
Inventors: Khoa-Van Nguyen; Etienne Corteel
Original assignee: SONIC EMOTION LABS
Current assignee: SONIC EMOTION LABS
Priority date: 2013-02-18
Filing date: 2013-02-18
Publication date: 2014-08-22
Anticipated expiration: 2033-02-18
Also published as: FR3002406B1; EP2957110A1; EP2957110B1; WO2014125232A1

Abstract

Le procédé permet de générer des signaux d'alimentation d'un système (1') de deux ensembles de haut-parleurs (E1',E2') situés de part et d'autre d'un plan de séparation (D'), en vue d'une restitution sonore d'un signal multicanal (S') vers deux positions spatiales d'écoute (P1',P2'), chacune associée à un ensemble de haut-parleurs et située sur un plan parallèle (L1',L2') au plan de séparation de sorte qu'au moins un haut-parleur de cet ensemble soit de part et d'autre de ce plan parallèle. Le procédé comprend, pour chaque ensemble de haut-parleurs, la génération, à partir d'un signal d'entrée dérivé du signal multicanal, de signaux d'alimentation des haut-parleurs de cet ensemble, comprenant l'application d'une technique de restitution transaurale au signal d'entrée créant une source sonore virtuelle (V1',V2') sur une première droite (d11',d22') obtenue par symétrie, par rapport au plan parallèle (P1',P2') sur lequel est située la position spatiale d'écoute associée à cet ensemble, d'une seconde droite (d12',d21') reliant la position spatiale d'écoute au haut-parleur le plus distant de cette position appartenant à l'autre ensemble de haut-parleurs .

Description

Arrière-plan de l'invention L'invention se rapporte au domaine général des traitements acoustiques et de la spatialisation des sons.

Elle concerne plus particulièrement un procédé de restitution sonore s'appuyant sur une technique transaurale. L'invention s'applique par exemple dans un espace restreint, tel que par exemple dans un habitacle de voiture ou d'un autre véhicule (ex. un avion) équipé d'au moins deux paires de haut-parleurs, en vue de reproduire une scène sonore stéréophonique large (i.e. spatialisée) autour de deux positions d'écoute connues auxquelles sont susceptibles de se trouver des auditeurs. Dans l'exemple de l'habitacle de la voiture, ces deux positions sont par exemple la position du conducteur de la voiture et celle de son passager. L'invention n'est toutefois pas limitée à cette seule application, et peut aisément s'appliquer à d'autres environnements sonores présentant une configuration de haut-parleurs similaire et dans lesquels on vise deux positions d'écoute différentes. Il existe dans l'état de la technique, des techniques de restitution sonore dites binaurales qui s'appuient sur les caractéristiques physiologiques de l'audition humaine, via l'utilisation de fonctions de transfert aussi appelées HTRF (pour Head Related Transfer Functions) qui traduisent l'ensemble des indices acoustiques spatiaux reçus au niveau des tympans d'un auditeur pour une source émise depuis un point donné de l'espace. Ces techniques binaurales permettent d'obtenir une spatialisation sonore très proche de l'écoute naturelle. Toutefois, elles se limitent à une restitution sonore par l'intermédiaire d'un casque d'écoute. Les techniques transaurales visent à adapter la synthèse binaurale à un dispositif de haut-parleurs. Dans le cas simple d'un dispositif à deux haut-parleurs utilisé pour restituer un signal stéréophonique à destination d'un auditeur unique, ces techniques s'emploient à diffuser, via les deux haut-parleurs du dispositif, le signal binaural droit uniquement sur l'oreille droite de l'auditeur, et le signal binaural gauche uniquement sur son oreille gauche. A cet effet, les signaux indésirables entre les haut-parleurs et les oreilles de l'auditeur sont éliminés par l'intermédiaire de techniques dites d'élimination des chemins croisés (CTC pour « CrossTalk Cancellation ») aussi connues sous le nom de techniques d'annulation d'écho. Autrement dit, le signal sonore émis par le haut-parleur droit sur l'oreille gauche, et le signal sonore émis par le haut-parleur gauche sur l'oreille droite sont éliminés ou tout du moins réduits par un traitement de signal approprié.

Le document de J. Bauck et al., intitulé « Generalized Transaural Stereo and Applications », Journal of Audio Engineering Society, vol. 44 n°9, sept. 1996 (ci-après Dl), décrit une technique transaurale généralisée pouvant être appliquée à un nombre quelconque de haut-parleurs et d'auditeurs.

La figure 1 illustre le système envisagé dans D1 : N programmes sonores (i.e., N signaux sonores multicanaux) sont utilisés pour générer M signaux alimentant respectivement M haut-parleurs d'un système de restitution destiné à L/2 auditeurs (autrement dit, L oreilles humaines). Le traitement permettant de générer les M signaux d'alimentation des haut-parleurs à partir des N programmes sonores est un traitement d'annulation de chemins croisés. Ce système peut être modélisé sous forme matricielle. Ainsi, si : Z désigne la matrice acoustique de transfert entre les N programmes sonores d'origine et les L signaux reçus respectivement par les oreilles des auditeurs, Y désigne la matrice de traitement CTC entre les N programmes sonores d'origine et les M signaux d'alimentation des M haut-parleurs (Y représente les filtres transauraux), et X désigne la matrice de propagation acoustique entre les M haut-parleurs et les L oreilles des auditeurs, l'équation matricielle suivante doit être résolue Z =XY (1) Dans cette équation matricielle, les matrices X et Z sont connues : en effet, la matrice Z caractérise le rendu sonore souhaité au niveau des auditeurs tandis que la matrice X est mesurable. On cherche donc une matrice de traitement Y vérifiant l'équation (1). La matrice X est de dimensions b(M : elle n'est donc pas nécessairement carrée. Par ailleurs, cette matrice n'est pas toujours bien conditionnée. Elle n'est donc pas toujours inversible.

En de telles conditions, il est usuel de recourir à la matrice pseudo-inverse de la matrice X, notée X+, et définie par : x+ = (v"x) où H définit l'opérateur hermitien.

La solution à l'équation (1) est alors donnée par : Y = X+Z (2) La technique proposée dans D1 est générale et convient en théorie à n'importe quelles valeurs de N, M et L. Toutefois, cette technique ne fonctionne que dans une configuration géométrique déterminée de haut-parleurs et de positions des auditeurs, et est particulièrement sensible à l'environnement acoustique des auditeurs. Elle requiert en outre l'inversion de la matrice acoustique X, qui pour de multiples raisons, comme mentionné précédemment, peut s'avérer problématique (en cas de mauvais conditionnement de la matrice), voire impossible pour certaines bandes de fréquences de la bande audible.

Il existe donc un besoin d'un procédé de restitution spatialisée d'un signal sonore à destination de deux positions spatiales déterminées, et via un système de restitution équipé d'au moins deux paires de haut-parleurs, qui soit robuste et ne présente pas les inconvénients précités de l'état de la technique.

Objet et résumé de l'invention L'invention répond notamment à ce besoin en proposant un procédé de génération de signaux d'alimentation destinés à un système de restitution sonore comprenant deux ensembles de haut-parleurs situés de part et d'autre d'un plan de séparation, ces signaux d'alimentation étant générés en vue d'une restitution sonore d'un signal sonore multicanal vers deux positions spatiales d'écoute, chaque position spatiale d'écoute étant associée à l'un des ensembles de haut-parleurs et étant située sur un plan parallèle au plan de séparation de sorte qu'au moins un haut-parleur de cet ensemble soit positionné de part et d'autre de ce plan parallèle, le procédé de génération comprenant, pour chaque ensemble de haut-parleurs, une étape de génération, à partir d'un signal d'entrée dérivé du signal sonore multicanal pour cet ensemble, de signaux d'alimentation destinés à alimenter les haut-parleurs de cet ensemble, cette étape de génération comprenant l'application d'une technique de restitution transaurale au signal d'entrée, cette technique créant une source sonore virtuelle sur une première droite obtenue par symétrie, par rapport au plan parallèle sur lequel est située la position spatiale d'écoute associée à cet ensemble, d'une seconde droite reliant la position spatiale d'écoute au haut-parleur le plus distant de cette position appartenant à l'autre ensemble de haut-parleurs du système de restitution. Corrélativement, l'invention vise également un dispositif de génération de signaux d'alimentation destinés à un système de restitution sonore comprenant deux ensembles de haut- parleurs situés de part et d'autre d'un plan de séparation, lesdits signaux étant générés en vue d'une restitution sonore d'un signal sonore multicanal vers deux positions spatiales d'écoute, chaque position spatiale d'écoute étant associée à l'un des ensembles de haut-parleurs et étant située sur un plan parallèle au plan de séparation de sorte qu'au moins un haut-parleur de cet ensemble est positionné de part et d'autre de ce plan parallèle, ce dispositif de génération comprenant des moyens aptes à générer pour chaque ensemble de haut-parleurs, à partir d'un signal d'entrée dérivé du signal sonore multicanal pour cet ensemble, des signaux d'alimentation destinés à alimenter les haut-parleurs de cet ensemble, ces moyens étant aptes à appliquer une technique de restitution transaurale au signal d'entrée, cette technique créant une source sonore virtuelle sur une première droite obtenue par symétrie, par rapport au plan parallèle sur lequel est située la position spatiale d'écoute associée à cet ensemble, d'une seconde droite reliant la position spatiale d'écoute au haut-parleur le plus distant de cette position appartenant à l'autre ensemble de haut-parleurs du système de restitution. Les haut-parleurs des deux ensembles de haut-parleurs du système de restitution peuvent être montés dans ou sur deux entités physiques disjointes, ou en variante, sur une même entité physique mais séparés par un plan « virtuel » vertical dit de séparation. Ils sont orientés en direction des positions d'écoute auxquelles ils sont associés, autrement dit, chaque position d'écoute se trouve dans la zone frontale des haut-parleurs de l'ensemble auquel elle est associée.

Ainsi, l'invention permet une restitution sonore spatialisée d'un signal sonore multicanal, à partir d'un réseau de haut-parleurs comprenant au moins deux ensembles de haut-parleurs, et simultanément pour deux positions d'écoute définies respectivement par rapport à ces deux ensembles de haut-parleurs.

Ces positions d'écoute ne sont pas nécessairement ponctuelles : il peut en effet s'agir de zones spatiales d'écoute à proprement parler, auquel cas on entend par position d'écoute située sur un plan parallèle au plan de séparation, le fait que le centre géométrique de cette position d'écoute se trouve sur le plan parallèle. Ces zones spatiales d'écoute sont définies préférentiellement par un rayon autour du centre géométrique inférieur à 15-20 cm.

Chaque ensemble de haut-parleurs du système de restitution envisagé pour la restitution sonore du signal multicanal comprend ainsi un haut-parleur de part et d'autre du plan parallèle sur lequel est située la position d'écoute. La position d'écoute est par exemple centrée par rapport à l'ensemble de haut-parleurs auquel elle est rattachée. Pour permettre une restitution sonore spatialisée, l'invention propose avantageusement de traiter séparément chaque ensemble de haut-parleurs et la position d'écoute qui lui est rattachée. Plus précisément, une technique transaurale distincte est utilisée pour chaque ensemble de haut-parleurs pour générer les signaux d'alimentation des haut-parleurs de cet ensemble. Cette technique transaurale est implémentée conformément à l'invention, de sorte à créer une source virtuelle à l'extérieur du réseau de haut-parleurs, dans la direction opposée par rapport à la position d'écoute associée à l'ensemble de haut-parleurs considéré, au haut-parleur du réseau le plus éloigné de cette position (et appartenant à l'autre ensemble de haut-parleurs). De cette sorte, l'invention associe d'une part les avantages d'une restitution transaurale appliquée à un faible nombre de haut-parleurs (résultant du traitement séparé effectué sur chaque ensemble de haut-parleurs), et d'autre part, le principe de précédence ou loi du premier front d'onde, bien connu de l'homme du métier. Selon ce principe, la localisation d'un objet sonore est donnée par la direction d'où provient le son qui arrive en premier à l'oreille (i.e. premier front d'onde). Pour mieux illustrer l'invention, considérons un signal sonore multicanal de type stéréo, que l'on souhaite restituer via un réseau frontal de haut-parleurs constitués de deux ensembles de deux haut-parleurs, ces ensembles étant placés respectivement face à deux positions spatiales d'écoute. L'invention revient, selon cet exemple, à spatialiser la partie gauche de la scène sonore (donnée par le canal gauche du signal stéréo) pour la position d'écoute située à gauche du plan de séparation (dite position d'écoute gauche) et à spatialiser la partie droite de la scène sonore (donnée par le canal droite du signal stéréo) pour la position d'écoute située à droite du plan de séparation, (dite position d'écoute droite), la partie droite de la scène sonore étant alors naturellement donnée pour la position d'écoute gauche par la position de l'ensemble des haut- parleurs situé à droite de celle-ci, et la partie gauche de la scène sonore étant naturellement donnée pour la position d'écoute droite par la position de l'ensemble des haut-parleurs situé à gauche de celle-ci. Il en résulte une technique de restitution sonore spatialisée relativement simple à mettre en oeuvre : les matrices à inverser dans les techniques transaurales implémentées selon l'invention sont en effet de dimensions réduites (matrices 2x2 dans l'exemple envisagé précédemment), puisqu'elles sont limitées à chaque ensemble de haut-parleurs. De cette sorte, elles ne souffrent pas ou peu des inconvénients de l'état de la technique (matrices de grandes dimensions difficiles à inverser et mal conditionnées). La technique de restitution proposée par l'invention est ainsi plus robuste à l'environnement du système de restitution. Par ailleurs, pour une configuration de système de restitution dans laquelle les haut-parleurs de chaque ensemble sont peu écartés (typiquement, pour un espacement maximal entre les haut-parleurs de 70 cm), la restitution sonore proposée par l'invention est moins sensible au phénomène dit de « sweet-spot » que la restitution sonore proposée dans Dl.

De façon connue, le « sweet-spot » définit une zone d'écoute idéale pour laquelle la restitution sonore est conçue et optimisée : cette zone d'écoute idéale correspond généralement à une unique position au centre du dispositif. Dans D1, lorsqu'un auditeur se déplace en dehors de cette zone d'écoute idéale, il perçoit non seulement un changement de l'image spatiale du signal sonore restitué, mais également un changement de timbre (i.e. une coloration du signal restitué). Au contraire dans l'invention, un auditeur placé au niveau d'une position d'écoute associée à un ensemble de haut-parleurs, et qui se trouve par là-même en dehors du « sweetspot » de la technique de restitution associée à l'autre ensemble de haut-parleurs et à l'autre position d'écoute, n'entend pas d'effet de spatialisation non désiré. Il entend uniquement un effet de coloration du signal d'entrée restitué par l'autre ensemble de haut-parleurs, mais celui-ci est perçu sur des haut-parleurs éloignés (i.e. sur les haut-parleurs de l'autre ensemble de haut-parleurs). Dans un mode particulier de réalisation de l'invention, les haut-parleurs des deux ensembles de restitution sont sensiblement alignés sur un axe horizontal du système de restitution.

Une telle configuration de haut-parleurs a une application privilégiée dans un espace de dimensions réduites tel un habitacle de voiture par exemple. Dans ce mode particulier de réalisation, au cours de l'étape de génération, la source virtuelle est créée préférentiellement à l'intersection de la première droite et de l'axe horizontal du système de restitution, de sorte à optimiser la restitution spatiale du signal sonore multicanal.

Dans un mode particulier de réalisation, le procédé de génération comprend en outre une étape d'égalisation spectrale au cours de laquelle, on applique individuellement à chaque signal d'alimentation destiné à alimenter un haut-parleur, un filtre d'égalisation adapté à ce haut-parleur.

Cette égalisation spectrale permet avantageusement de prendre en compte l'environnement dans lequel se trouve le système de restitution. De manière générale, et plus spécifiquement lorsque le système de restitution se trouve dans un environnement clos tel que par exemple l'habitacle d'une voiture, on peut s'attendre à ce que le timbre du signal sonore multicanal restitué ne soit pas identique aux deux positions d'écoute. L'égalisation spectrale peut être mise en oeuvre en vue de corriger cet effet. Elle va par la même occasion, pour chaque position d'écoute, corriger l'effet de coloration dû à la technique transaurale appliquée à l'ensemble de haut-parleurs opposé à la position d'écoute. Différents critères peuvent donc être envisagés pour dériver ces filtres d'égalisation.

Selon un premier critère, chaque filtre d'égalisation adapté à un haut-parleur est choisi de sorte à obtenir un spectre d'amplitude d'une réponse fréquentielle établie pour ce haut-parleur à partir de mesures réalisées dans un environnement insonorisé, conforme à un premier spectre cible prédéterminé (ex. spectre d'amplitude plat). L'application de ce premier critère vise à corriger individuellement les défauts de chaque haut-parleur, et à réduire les différences pouvant apparaître entre eux. L'égalisation vise à harmoniser les spectres d'amplitude des réponses fréquentielles des différents haut-parleurs. Selon une deuxième variante, les filtres d'égalisation sont choisis de sorte à obtenir un spectre d'amplitude moyen évalué à partir des réponses impulsionnelles des haut-parleurs des ensembles du système de restitution, conforme à un second spectre cible prédéterminé.

Ce second critère vise au contraire une égalisation moyenne globale de tous les signaux d'alimentation des haut-parleurs, en vue par exemple d'améliorer le timbre (ou coloration) du signal restitué. Dans un mode particulier de réalisation, le procédé de génération comprend en outre une étape d'analyse spatiale du signal sonore multicanal comprenant l'extraction d'au moins un objet sonore et la détermination d'une position spatiale de cet objet sonore, chaque signal d'entrée utilisé pour générer les signaux d'alimentation des haut-parleurs d'un ensemble de haut-parleurs étant élaboré à partir d'au moins un objet sonore extrait lors de cette étape d'analyse spatiale et sélectionné en fonction de sa position spatiale par rapport au plan de séparation. L'invention permet par le biais de cette analyse spatiale de traiter n'importe quel signal sonore multicanal et d'optimiser le rendu de ce signal sonore, via l'extraction des objets sonores de ce système. Dans un autre mode de réalisation, le système de restitution comprend en outre un troisième ensemble de haut-parleurs, au moins un haut-parleur de ce troisième ensemble étant placé de part et d'autre du plan de séparation.

Ce troisième ensemble de haut-parleurs permet notamment de restituer les objets sonores du signal multicanal dont la position spatiale déterminée au cours de l'étape d'analyse spatiale est au centre.

Dans un mode préférentiel de réalisation, chaque ensemble de haut-parleurs du système de restitution comprend une paire de haut-parleurs. Dans un mode particulier de réalisation, les différentes étapes du procédé de génération sont déterminées par des instructions de programmes d'ordinateurs ou de microprocesseurs. En conséquence, l'invention vise aussi un programme d'ordinateur ou de microprocesseur sur un support d'informations, ce programme étant susceptible d'être mis en oeuvre dans un dispositif de génération ou plus généralement dans un ordinateur ou par un microprocesseur, ce programme comportant des instructions adaptées à la mise en oeuvre des étapes d'un procédé de génération tel que décrit ci-dessus. Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable. L'invention vise aussi un support d'informations lisible par un ordinateur, et comportant des instructions d'un programme d'ordinateur tel que mentionné ci-dessus. Le support d'informations peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette (floppy disc) ou un disque dur.

D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet. Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question. Selon un autre aspect, l'invention vise également un système de restitution sonore comprenant : - au moins deux ensembles de haut-parleurs ; et - un dispositif de génération de signaux d'alimentation destinés aux haut-parleurs desdits deux ensembles de haut-parleurs selon l'invention. Dans un autre mode de réalisation, le système de restitution sonore comprend au moins deux ensembles de haut-parleurs situés dans un plan frontal par rapport aux positions d'écoute et au moins deux ensembles de haut-parleurs situés dans un plan arrière par rapport aux positions d'écoute. Ce mode de réalisation est particulièrement bien adapté à la restitution de signaux multicanaux comprenant des signaux arrière comme par exemple des signaux ayant un format 5.1.

On peut également envisager, dans d'autres modes de réalisation, que le procédé de génération, le dispositif de génération et le système selon l'invention présentent en combinaison tout ou partie des caractéristiques précitées.

Brève description des dessins D'autres caractéristiques et avantages de la présente invention ressortiront de la description faite ci-dessous, en référence aux dessins annexés qui en illustrent des exemples de réalisation dépourvus de tout caractère limitatif. Sur les figures : la figure 1 déjà décrite représente, de façon schématique, une technique de restitution transaurale généralisée de l'état de la technique ; la figure 2 représente un système de restitution conforme à l'invention comprenant un dispositif de génération de signaux d'alimentation destinés à des ensembles de haut-parleurs, conforme à l'invention ; la figure 3 illustre l'architecture matérielle du dispositif de génération de la figure 2 ; la figure 4 représente un système de restitution et un dispositif de génération conformes à l'invention dans un premier mode particulier de réalisation de l'invention ; la figure 5 illustre les principales étapes du procédé de génération selon l'invention telles qu'elles sont mises en oeuvre par le dispositif de génération de la figure 4 dans le premier mode de réalisation ; les figures 6A et 6B illustrent comment peuvent être déterminés les filtres d'égalisation pouvant être utilisés lors du procédé de génération représenté à la figure 5 ; la figure 7 illustre une variante du premier mode particulier de réalisation de l'invention ; la figure 8 représente un système de restitution et un dispositif de génération conformes à l'invention dans un deuxième mode particulier de réalisation de l'invention ; la figure 9 illustre les principales étapes du procédé de génération selon l'invention telles qu'elles sont mises en oeuvre par le dispositif de génération de la figure 8 dans le deuxième mode de réalisation ; et la figure 10 représente un système de restitution et un dispositif de génération conformes à l'invention dans un troisième mode particulier de réalisation de l'invention.

Description détaillée de l'invention Nous allons maintenant décrire, en référence aux figures 2 à 10, trois modes de réalisation particuliers de l'invention. Dans ces trois modes de réalisation, on envisage, comme illustré schématiquement à la figure 2, la restitution d'un signal sonore S multicanal via un système de restitution 1 conforme à l'invention, comprenant une pluralité d'ensembles de haut-parleurs El,...,EN, (N supérieur ou égal à 2), et un dispositif 2 de génération de signaux d'alimentation à ces ensembles de haut-parleurs, conforme à l'invention.

Chaque ensemble de haut-parleurs comprend au moins une paire de haut-parleurs et est associé à une position d'écoute déterminée, cette position d'écoute étant centrée ici par rapport à cet ensemble de haut-parleurs, de sorte qu'au moins un haut-parleur de l'ensemble est situé de part et d'autre de la position d'écoute.

Plus généralement, les haut-parleurs de chaque ensemble sont positionnés de part et d'autre d'un plan vertical passant par la position d'écoute et parallèle à un plan vertical de séparation situés entre les deux ensembles de haut-parleurs. Toutefois, l'hypothèse selon laquelle chaque position d'écoute est centrée par rapport à l'ensemble de haut-parleurs auquel elle est associée n'est pas limitative en soi : les haut-parleurs d'un ensemble de haut-parleurs peuvent être disposés de façon asymétrique par rapport à la position d'écoute. Les ensembles de haut-parleurs peuvent être montés sur des entités physiques distinctes ou au contraire sur une même entité tout en délimitant des zones distinctes de l'espace. De même, le dispositif de génération 2 n'est pas nécessairement localisé sur la même entité physique que les ensembles de haut-parleurs. Dans les modes de réalisation décrit ici, le dispositif de génération 2 selon l'invention a l'architecture matérielle d'un ordinateur, comme illustré schématiquement à la figure 3. Il comporte notamment un processeur 3, une mémoire morte 4, une mémoire vive 5, une mémoire non volatile 6 et des moyens de communication 7 d'une part avec une source lui fournissant le signal sonore multicanal S (non représentée sur la figure 2) et d'autre part, avec les haut-parleurs des ensembles de haut-parleurs El,. .,EN auxquels le dispositif de génération 2 fournit les signaux d'alimentation qu'il a générés. Ces moyens de communication peuvent être par exemples des moyens de communication filaires, ou en variante, des moyens de communication sans fil utilisant une technologie WiFI (Wireless FIdelity) par exemple ou BluetoothTM.

La mémoire morte 4 du dispositif de génération 2 constitue un support d'enregistrement conforme à l'invention, lisible par le processeur 3 et sur lequel est enregistré un programme d'ordinateur conforme à l'invention, comportant des instructions pour l'exécution des étapes d'un procédé de génération selon l'invention décrites ultérieurement en référence aux figures 5 et 9, dans différents modes particuliers de réalisation. Ce programme d'ordinateur définit, de façon équivalente, des modules fonctionnels du dispositif 2 de génération (i.e. module de génération, module de génération et le cas échéant module d'analyse du signal sonore S et d'égalisation). Par souci de simplification et de clarté dans la suite de la description, les éléments similaires sont référencés à l'aide de références numériques identiques indexés par ', "ou " selon le mode de réalisation envisagé. Nous allons maintenant décrire en référence aux figures 4 à 7 un premier mode particulier de réalisation de l'invention.

Pour illustrer ce premier mode de réalisation, on envisage à la figure 4 un système de restitution 1' d'un signal stéréo S' comprenant deux ensembles de haut-parleurs El' et E2', chaque ensemble comprenant une paire de haut-parleurs (H111, H12' pour l'ensemble El' et H21', H22' pour l'ensemble E2').

Les deux ensembles El' et E2' sont situés de part et d'autre d'un plan de séparation vertical D'. Dans l'exemple représenté à la figure 4, le plan de séparation vertical D' définit un plan de symétrie pour les deux ensembles de haut-parleurs El' et E2'. Les haut-parleurs H11', H12', H21', H22' sont, dans l'exemple illustré à la figure 4, alignés ou sensiblement alignés sur un même axe horizontal A' du système de restitution.

L'invention ne se limite toutefois pas à une telle configuration alignée des haut- parleurs. Ainsi à titre illustratif, les haut-parleurs H11' et H22' peuvent être sur l'axe A' tandis que H12' est positionné au dessus de l'axe A' et H21' en dessous, etc. Chaque ensemble de haut-parleurs El', E2' est positionné face à une position d'écoute privilégiée Pl', P2'. Ces positions d'écoute sont situées sur des plans verticaux Li' et L2' respectivement, qui sont parallèles au plan de séparation D'. Il convient de noter que les positions d'écoute P1' et P2' ne sont pas nécessairement ponctuelles. Au sens de l'invention Pl' et P2' sont situées sur un plan parallèle au plan de séparation dès lors que leur centre géométrique est situé sur ce plan parallèle. Selon l'exemple illustré à la figure 4, la position d'écoute est centrée par rapport à l'ensemble de haut-parleurs El', autrement dit, le plan Li' est un plan médian de l'ensemble de haut-parleurs El', orthogonal à l'axe A'. De même, la position d'écoute P2' est centrée par rapport à l'ensemble de haut- parleurs E2', autrement dit, le plan L2' est un plan médian de l'ensemble de haut-parleurs E2', orthogonal à l'axe A'.

On suppose que les positions d'écoute P1' et P2' sont occupées par deux auditeurs. Ainsi, conformément à cette configuration, les auditeurs (i.e. positions d'écoute) et les haut-parleurs sont placés de façon symétrique par rapport au plan de séparation D'. Toutefois cette hypothèse n'est pas limitative et on peut envisager en variante que les deux ensembles de haut-parleurs El' et E2' soient placés de façon asymétrique par rapport au plan de séparation D'. Dans l'exemple envisagé à la figure 4, le signal S' est un signal stéréo, composé de deux canaux gauche et droite, notés respectivement SL' et SR'. Nous allons maintenant décrire en référence à la figure 5, les principales étapes du procédé de génération selon l'invention, dans le premier mode de réalisation, lorsqu'il est mis en oeuvre par le dispositif de génération 2' pour fournir des signaux d'alimentation aux haut-parleurs des ensembles El' et E2'.

Sur réception du signal sonore S', le dispositif de génération 2' met en oeuvre une analyse spatiale de ce signal (étape E10), afin d'identifier les composantes (i.e. objets sonores) de ce signal destinées à être restituées sur les différents ensembles de haut-parleurs. Le signal sonore S' étant un signal stéréo dans l'exemple envisagé à la figure 4, cette analyse spatiale se limite ici à associer au premier ensemble de haut-parleurs El' situé à gauche du plan de séparation D' dans l'espace de restitution sonore, le canal gauche SL' du signal stéréo, et au deuxième ensemble de haut-parleurs E2' situé à droite du plan de séparation D' dans l'espace de restitution sonore, le canal droite SR' du signal stéréo. Les signaux SL' et SR' sont des signaux d'entrée au sens de l'invention pour l'ensemble El' et pour l'ensemble E2' respectivement.

Puis conformément à l'invention, le dispositif de génération 2' applique deux techniques transaurales distinctes à chacun des signaux d'entrée SL' et SR'. Chaque ensemble de haut-parleurs El' et E2' est ainsi traité séparément conformément à l'invention. Plus précisément, au cours de l'étape E20, le dispositif de génération 2' applique une première technique transaurale Ti' au signal d'entrée SL' de sorte à créer une source virtuelle V1.1 dans une direction symétrique par rapport au plan Li' passant par la position d'écoute P1' à la direction du haut-parleur de l'ensemble E2' le plus distant de la position d'écoute P1', autrement dit à la direction du haut-parleur H22'. Cette source virtuelle V1' est créée, dans l'exemple envisagé à la figure 4, à l'intersection de l'axe A' et de la droite dll' (première droite au sens de l'invention) passant par la position d'écoute P1' et symétrique de la droite d12' (seconde droite au sens de l'invention) reliant la position d'écoute P1' au haut-parleur H22'. Autrement dit, dans l'exemple de la figure 4, V1' est le symétrique (en distance et en direction) du haut-parleur H22' par rapport au plan L1'. De cette sorte, l'auditeur se trouvant à la position d'écoute P1' dispose d'une scène sonore s'étendant entre la direction donnée par la source virtuelle V:I! (c'est-à-dire par la droite dll') et la direction donnée par le haut-parleur H22' (c'est-à-dire par le droite d12'). Selon une autre configuration de haut-parleurs dans laquelle les haut-parleurs des ensembles El' et E2' ne sont pas alignés sur un même axe A', la source virtuelle V1' peut également être créée sur la droite dl l' de sorte à être le symétrique en direction et en distance du haut-parleur H22' par rapport au plan L1'.

Toutefois, il convient de noter que la mise en oeuvre de l'invention n'impose pas qu'une symétrie en termes de distance soit impérativement respectée. Il suffit que la source virtuelle V11 soit créée sur la droite dll', c'est-à-dire dans une direction symétrique à la direction d12' par rapport au plan Li', que les haut-parleurs soient alignés ou non sur un même axe. L'étape E20 est mise en oeuvre par le dispositif de génération 2' en filtrant le signal SL' par des filtres transauraux déterminés de sorte à créer la source virtuelle V1'. En d'autres mots, ces filtres transauraux sont définis de telle façon que l'auditeur placé à la position d'écoute P1' reçoive sur ses deux oreilles deux signaux binauraux qui définissent la source virtuelle V11.

Plus spécifiquement, si l'on suppose, en reprenant les notations précédemment introduites en référence à la figure 1, que : Z1' est une matrice acoustique de transfert entre le signal d'entrée SL' et les deux signaux reçus respectivement par les oreilles de l'auditeur situé à la position d'écoute Pr (Z1' est en fait un vecteur à deux composantes dans l'exemple envisagé ici), Yr est une matrice de traitement transaural entre le signal d'entrée SL' et les deux signaux d'alimentation des haut-parleurs Hlr et H12' (Yr représente les filtres transauraux et est également un vecteur à deux composantes dans l'exemple envisagé ici), et X1' désigne une matrice de propagation acoustique entre les deux haut-parleurs H11' et H12' et les oreilles de l'auditeur placé à la position d'écoute Pr (X1' est de dimension 2x2 ici), la matrice Yr contenant les filtres transauraux appliqués au signal SL' vérifie l'équation matricielle suivante : Z1'.. XVY1' Autrement dit, les filtres transauraux appliqués au signal SL' sont obtenus par inversion de la matrice X1' et multiplication de la matrice inverse ainsi obtenue par la matrice Z1'. Comme mentionné précédemment, les matrices Z1' et Xi' sont connues : Z1' contient les filtres binauraux qui correspondent à la création de la source virtuelle Vr, et X1' contient la réponse impulsionnelle des haut-parleurs H11' et H12'. La détermination des filtres binauraux permettant la création de la source virtuelle V1' ne pose pas de difficulté en soi pour l'homme du métier et ne sera pas décrite davantage ici. On peut se référer notamment au document WO 95/23493. La matrice Xr se compose quant à elle de quatre trajets acoustiques, à savoir le trajet entre le haut-parleur H111 et l'oreille gauche de l'auditeur placé en Pr, le trajet entre le haut-parleur H11' et l'oreille droite de l'auditeur, le trajet entre haut-parleur H12' et l'oreille gauche de l'auditeur et enfin le trajet entre le haut-parleur H12' et l'oreille droite de l'auditeur. Elle peut être déterminée de différentes façons. Ainsi, à titre d'exemples : Xr peut être mesurée directement aux oreilles de l'auditeur en posant des microphones binauraux au niveau de ses oreilles ; Xr peut être simulée en utilisant une base de données de fonctions HRTF et en extrayant les HTRF dans la direction des haut-parleurs H11' et H12' par rapport à l'auditeur placé à la position d'écoute Pr ; ou Xi' peut être simulée grâce à des fonctions HTRF correspondant à un modèle de tête sphérique bien connues de l'homme du métier. L'application des filtres transauraux de la matrice Yi' ainsi déterminés au signal SL' résulte en deux signaux d'alimentation S11' et S12' destinés à alimenter respectivement les deux haut-parleurs H11' et H12' de l'ensemble El'. Dans le premier mode de réalisation décrit ici, ces signaux d'alimentation S11' et S12' sont égalisés à l'aide de filtres d'égalisation individuels Fr, F2' avant d'être fournis aux haut- parleurs H11' et H22' (étape E30). Cette étape d'égalisation spectrale a pour but de compenser les éventuels défauts des haut-parleurs H11' et H12' (par exemple, le timbres des haut-parleurs), et de réduire les différences pouvant exister entre ces différents haut-parleurs. Les filtres d'égalisation Fr et F2', appliqués respectivement sur les signaux Sur et S12' sont bien entendu prédéterminés au cours d'une étape préliminaire, et stockés dans la mémoire non volatile du dispositif de génération 2'. Une méthode pouvant être mise en oeuvre au cours de cette étape préliminaire pour déterminer les filtres Fr et F2' est la suivante. Dans un premier temps, des mesures sont effectuées pour chaque haut-parleur H11' et H12' en environnement insonorisé (i.e. traité acoustiquement) avec un microphone omnidirectionnel placé en face de chaque haut-parleur et des signaux de référence connus (ex. bruit blanc). Ces mesures permettent d'obtenir les réponses impulsionnelles de chaque haut-parleur H11' et H12'. Puis pour chaque haut-parleur, on réalise une moyenne temporelle des différentes réponses impulsionnelles mesurées pour ce haut-parleur de sorte à obtenir une réponse impulsionnelle moyenne. La réponse impulsionnelle moyenne est ensuite transformée en une réponse fréquentielle, de façon connue en soi, par exemple par l'intermédiaire d'une transformation de Fourier. Cette réponse fréquentielle moyenne est ensuite éventuellement lissée par bande de fréquences (ex. bandes d'octave ou bandes auditives). Puis on détermine le spectre d'amplitude de cette réponse fréquentielle. Le filtre d'égalisation est alors choisi de sorte à obtenir un spectre d'amplitude de la réponse fréquentielle éventuellement lissée conforme à un spectre d'amplitude cible prédéterminé SPcible (premier spectre cible au sens de l'invention). Ce spectre d'amplitude cible est par exemple un spectre plat, c'est-à-dire constant quelle que soit la fréquence. En d'autres mots, si SP1' et SP2' désignent respectivement le spectre d'amplitude de la réponse fréquentielle ainsi déterminée du haut-parleur H11' et du haut-parleur H12' de l'ensemble El', le filtre d'égalisation Fr, respectivement F2', est choisi de sorte à minimiser la différence entre SP1' et SPcible, respectivement entre SP2' et SPCible, dans une limite par exemple de plus ou moins 5dB. On s'assure ainsi qu'en moyenne, le spectre d'amplitude de la réponse fréquentielle de chaque haut-parleur de l'ensemble de haut-parleurs El est identique ou similaire au spectre d'amplitude SPCible et donc entre eux. Il convient de noter que dans l'exemple envisagé ici, seule l'amplitude de la réponse impulsionnelle de chaque haut-parleur est corrigée, on ne s'intéresse pas à la phase à proprement parler. Le filtrage du signal S11' par le filtre Fr résulte en un signal d'alimentation filtré Suif, qui est fourni par le dispositif 2' au haut-parleur Hlr pour restitution (étape E40).

De même, le filtrage du signal S12' par le filtre F2' résulte en un signal d'alimentation filtré S12r, qui est fourni par le dispositif 2' au haut-parleur H12' pour restitution (étape E40). De façon similaire, et en parallèle des étapes E20-E40, le dispositif de génération 2' applique une seconde technique transaurale T2' au signal d'entrée SR' de sorte à créer une source virtuelle V2' dans une direction symétrique par rapport au plan L2' passant par la position d'écoute P2' à la direction du haut-parleur de l'ensemble El' le plus distant de la position d'écoute P2', autrement dit du haut-parleur H11' (étape E50) Cette source virtuelle V2' est créée, dans l'exemple envisagé à la figure 4, à l'intersection de l'axe A' et de la droite d22' (première droite au sens de l'invention) passant par la position d'écoute P2' et symétrique de la droite d12' (seconde droite au sens de l'invention) reliant la position d'écoute P2' au haut-parleur H11'. De cette sorte, l'auditeur se trouvant à la position d'écoute P2' dispose d'une scène sonore s'étendant entre la direction donnée par la source virtuelle V2' (c'est-à-dire par la droite d22') et la direction donnée par le haut-parleur I-111' (c'est-à-dire par la droite d12').

L'étape E50 est mise en oeuvre par le dispositif de génération 2' en filtrant le signal SR' par des filtres transauraux déterminés de sorte à créer la source virtuelle V2'. Ces filtres transauraux sont déterminés de façon similaire ou identique aux filtres transauraux appliqués lors de l'étape E20 pour la création de la source virtuelle Vr et ne seront donc pas décrits à nouveau ici.

L'application des filtres transauraux au signal SR' résulte en deux signaux d'alimentation S21' et S22' destinés à alimenter respectivement les deux haut-parleurs H21' et H22' de l'ensemble E2'. Dans le premier mode de réalisation décrit ici, ces signaux d'alimentation S21' et S22' sont égalisés à l'aide de filtres d'égalisation individuels F3', F4' avant d'être fournis aux haut- parleurs H21' et H22' (étape E60). Cette étape d'égalisation spectrale a pour but de compenser les éventuels défauts des haut-parleurs (par exemple, le timbres des haut-parleurs), et de réduire les différences pouvant exister entre les différents haut-parleurs (i.e. entre H21' et H22' ici). Les filtres d'égalisation F3' et F4', appliqués respectivement sur les signaux S21' et S22' sont prédéterminés au cours d'une étape préliminaire, de façon similaire ou identique aux filtres d'égalisation Fr et F2', et sont stockés dans la mémoire non volatile du dispositif de génération 2'. Le filtrage du signal S21' par le filtre F3' résulte en un signal d'alimentation filtré S21r, fourni au haut-parleur H21' pour restitution (étape E70). De même, le filtrage du signal S22' par le filtre F4' résulte en un signal d'alimentation filtré S22r, fourni au haut-parleur H22' pour restitution (étape E70). Dans le premier mode de réalisation décrit ici, les filtres Fr, F2', F3', F4' sont déterminés de sorte à compenser d'éventuels défauts des haut-parleurs Hlr, H12', H21' et H22' respectivement, et à harmoniser le timbre de ces haut-parleurs.

Dans une variante de réalisation, on peut envisager d'appliquer aux signaux S11', S12', S21' et S22' obtenus après application des techniques transaurales Tr et T2', des filtres d'égalisation spectrale (un filtre pour chaque haut-parleur) visant à améliorer le timbre ou la coloration du système 1' de restitution dans son ensemble, c'est-à-dire incluant les deux ensembles de haut-parleurs El' et E2'. Ces filtres peuvent alors être déterminés de la façon suivante. Dans un premier temps, on réalise plusieurs mesures dans l'environnement réel dans lequel sont positionnés les haut-parleurs du système de restitution 1' (ex. habitacle de la voiture si le système de restitution 1' est inclus dans un tel habitacle), de la réponse innpulsionnelle de ces haut-parleurs sur un réseau de microphones distribués sur la zone d'écoute visée et qui inclut les positions d'écoute Pl' et P2' (autrement dit, la zone d'écoute visée est définie à proximité des positions d'écoute Pr et P2'). La figure 6A illustre un réseau de quatre microphones ml, m2, m3 et m4 dûment positionnés pour le système 1'. Les réponses impulsionnelles ainsi mesurées sont moyennées sur l'ensemble des haut- parleurs pour chaque microphone de sorte à obtenir une réponse impulsionnelle moyenne pour chaque microphone. Puis les réponses impulsionnelles moyennes sont transformées en des réponses fréquentielles à l'aide d'une transformation de Fourier par exemple. Un lissage fréquentiel des réponses fréquentielles ainsi obtenues peut être réalisé (par exemple par octave ou par bande auditive). On évalue alors la moyenne fréquentielle des spectres d'amplitude des réponses fréquentielles éventuellement lissées associées aux microphones. Le spectre d'amplitude moyen ainsi obtenu inclut ainsi la contribution de tous les haut-parleurs du système de restitution 1' sur tous les microphones ml, m2, m3 et m4.

Les filtres d'égalisation à appliquer sur les signaux d'alimentation avant leur fourniture aux haut-parleurs sont alors choisis de sorte à obtenir un spectre d'amplitude moyen conforme (dans une tolérance par exemple de +/- 5dB) à spectre d'amplitude cible prédéterminé SPcible' (seconde réponse fréquentielle au sens de l'invention). Ce spectre d'amplitude cible est par exemple un spectre plat, comme illustré à la figure 6B, c'est-à-dire constant quelle que soit la fréquence. Il convient de noter que les filtres permettant d'améliorer le timbre du système 1' dans son ensemble peuvent être appliqués de façon alternative aux filtres Fr, F2', F3', F4' précédemment décrits, ou en complément de ces filtres (on applique aux signaux d'alimentation les deux ensembles de filtres successivement ou des filtres équivalents).

Dans l'exemple envisagé à la figure 4, les ensembles de haut-parleurs El' et E2' comprennent chacun une paire de haut-parleurs. Toutefois, l'invention peut également s'appliquer de façon similaire à une configuration différente des ensembles de haut-parleurs El' et E2', comme illustrée à la figure 7.

Ainsi, selon l'exemple de la figure 7, chaque ensemble de haut-parleurs El' et E2' comprend trois haut-parleurs H11', H12', H13' et H21', H22', H23' respectivement. La source virtuelle V1' est alors créée à une position symétrique par rapport au plan Li' de la position du haut-parleur H23', tandis que la source virtuelle V2' est créée à une position symétrique par rapport au plan L2' de la position du haut-parleur H11'. Nous allons maintenant décrire en référence aux figures 8 et 9, un deuxième mode de réalisation de l'invention. Pour illustrer ce deuxième mode de réalisation, on envisage à la figure 8 un système de restitution 1" d'un signal stéréo S" comprenant deux ensembles de haut-parleurs El" et E2" disposés de façon similaire aux ensembles El' et E2' de la figure 4, de part et d'autre d'un plan de séparation vertical D". Chaque ensemble de haut-parleurs El", E2" est placé face à une position d'écoute privilégiée Pl", P2" définies de façon similaire à ce qui a été décrit précédemment pour P1' et P2', et comprend une paire de haut-parleurs (H11", H12" pour l'ensemble El" et H21", H22" pour l'ensemble E2"). Pl" et P2" sont situées respectivement sur des plans verticaux Li" et L2" parallèles au plan de séparation D". Un haut-parleur de l'ensemble El" est ainsi positionné de part et d'autre de Li" et de la position d'écoute Pl", et un haut-parleur de l'ensemble E2" est positionné de part et d'autre de L2" et de la position d'écoute P2". Le système de restitution 1" comprend en outre un troisième ensemble E3" de deux haut-parleurs H31" et H32", placé au centre du système de restitution 1", entre les deux ensembles El" et E2", comme illustré sur la figure 8. Plus précisément, l'ensemble de haut-parleurs E3" est positionné au niveau du plan de séparation D" : au moins un haut-parleur de l'ensemble E3" est placé de part et d'autre du plan de séparation D". Les haut-parleurs H11", H12", H21", H22", H31" et H32" sont dans l'exemple illustré à la figure 8, alignés ou sensiblement alignés sur un même axe horizontal A" du système de restitution. Toutefois, comme mentionné précédemment, cette hypothèse n'est pas limitative et aucune limitation n'est attachée à proprement parler au placement des haut-parleurs des ensembles El", E2" et E3" par rapport à cet axe horizontal. Nous allons maintenant décrire en référence à la figure 9, les principales étapes du procédé de génération selon l'invention, dans le deuxième mode de réalisation, lorsqu'il est mis en oeuvre par le dispositif de génération 2" pour fournir des signaux d'alimentation aux haut-parleurs des ensembles El", E2" et E3". Sur réception du signal sonore S", le dispositif de génération 2" met en oeuvre une analyse spatiale de ce signal (étape F10), afin d'identifier les composantes (i.e. objets sonores) de ce signal qui seront restitués sur les différents ensembles de haut-parleurs. A cet effet, dans le deuxième mode de réalisation décrit ici, l'étape d'analyse F10 comprend une décomposition du signal sonore S" en plusieurs sous-bandes fréquentielles (ex. en octave, ou en bandes auditives selon la puissance de traitement disponible pour mettre en oeuvre l'invention). Puis le dispositif 2" extrait sur chaque sous-bande fréquentielle les objets sonores contenus dans le signal S", et détermine pour chaque objet sonore, sa position spatiale.

Il utilise à cette fin des techniques connues de l'homme du métier, comme par exemple la détermination d'un vecteur de Gerzon représentatif du signal S" telle que décrite dans le document US 2007/0269063, ou une décomposition en harmoniques sphériques telle que décrite dans le document WO 2012/025580. Le dispositif 2" génère ensuite à partir des objets sonores ainsi extraits trois signaux d'entrée notés SL", SR" et SC" destinés aux trois ensembles de haut-parleurs El", E2" et E3". Les objets sonores sélectionnés pour chaque signal d'entrée dépendent ici de leurs positions spatiales par rapport au plan de séparation D" (et plus généralement de critères d'analyse prédéterminés qui déterminent vers quel ensemble de haut-parleur envoyer quel objet sonore en fonction de sa position spatiale). Dans le mode de réalisation envisagé ici : les objets sonores se trouvant à gauche du plan de séparation D" sont alors intégrés dans le signal SL" dérivé pour l'ensemble El", les objets sonores se trouvant à droite du plan de séparation D" sont alors intégrés dans le signal SR" dérivé pour l'ensemble E2", et les objets sonores se trouvant à proximité du plan de séparation D" sont alors intégrés dans le signal SC" dérivé pour l'ensemble E3". Puis conformément à l'invention, le dispositif de génération 2" applique deux techniques transaurales distinctes à chacun des signaux d'entrée SL" et SR", de façon similaire à ce qui a été décrit précédemment en référence à la figure 5. Les étapes F20 et F50 d'application d'une technique transaurale résultant en la création de deux sources virtuelles Vl" et V2", les étapes F30 et F60 d'égalisation spectrale par les filtres Fi", F2", F3" et F4", et les étapes F40 et F70 de génération des signaux d'alimentation aux haut-parleurs des ensembles El" et E2" étant identiques respectivement aux étapes E20 et E50, aux étapes E30 et E60, et aux étapes E40 et E70, elles ne sont pas décrites de nouveau ici. Dans le deuxième mode de réalisation décrit ici, le dispositif de génération 2" applique en outre une technique de restitution spatiale T3" au signal d'entrée SC" afin de générer des signaux d'alimentation des haut-parleurs H31" et H32" du troisième ensemble central de haut-parleurs E3" (étape F80). Cette technique de restitution est choisie par exemple de sorte à diffuser directement le signal SC" sur les haut-parleurs H31" et H32".

Les signaux d'alimentation S31" S32" générés par application de la technique T3" au signal d'entrée SC" sont ensuite filtrés à l'aide de filtres d'égalisation (pouvant être déterminés selon une méthode similaire à celle expliquée précédemment pour déterminer les filtres F1', F2', F3' et F4') (étape F90).

Puis les signaux filtrés S31f" et S32f" sont fournis par le dispositif de génération 2" aux haut-parleurs H31" et H32" respectivement (étape F100). En variante, on peut envisager que la technique de restitution spatiale T3" appliquée au signal d'entrée SC" génèrent des signaux d'alimentation pour les haut-parleurs des trois ensembles El", E2" et E3", en utilisant une technique de restitution holophonique telle que par exemple une technique WFS (pour Wave Field Synthesis). Ainsi, par le biais de cette technique, on peut par exemple créer une source virtuelle au centre, placée sur le plan de séparation D" à une distance assez lointaine des positions d'écoute en termes de front d'onde (typiquement à une distance supérieure à 10m), de sorte que les auditeurs placés au niveau des positions d'écoute P1" et P2" perçoivent le centre de signaux restitués devant eux. Bien entendu, ce deuxième mode de réalisation peut être décliné selon les différentes variantes précédemment envisagées pour le premier mode de réalisation. Par ailleurs, pour illustrer les premier et deuxième modes de réalisation, on a considéré des signaux sonores S' et S" stéréo.

Toutefois l'invention s'applique également à d'autres types de signaux multicanaux, comme par exemple à un signal multi-canal 5.1. La figure 10 illustre un système de restitution 1" selon un troisième mode de réalisation, permettant la restitution d'un signal sonore S" 5.1, composé d'un canal gauche (SL"), d'un canal droit (SR"), d'un canal arrière gauche (SLsm), d'un canal arrière droit (SRs"), d'un canal central (SC"), et d'un canal de grave (SLfe'"). Le système de restitution 1" comprend deux sous-systèmes « avant » A et « arrière » B, placés respectivement devant et derrière les positions d'écoute Pl" et P2" (par rapport au positionnement des auditeurs à ces positions d'écoute). Le sous-système A comprend trois ensembles de haut-parleurs EAl", EA2" et EA3" disposés par rapport aux positions d'écoute Pl" et P2", et par rapport au plan vertical de séparation D" de façon identique aux ensembles de haut-parleurs El", E2" et E3" considérés précédemment pour illustrer le deuxième mode de réalisation. Le sous-système B comprend en outre deux ensembles de haut-parleurs EB1" et EB2" disposés à l'arrière des positions d'écoute Pl" et P2" de façon identique aux ensembles de haut- parleurs El' et E2' considérés précédemment pour illustrer le premier mode de réalisation. EB1" et EB2" sont placés de part et d'autre du plan vertical de séparation D", et sont centrés respectivement par rapport aux plans verticaux Li" et L2" qui sont parallèles au plan de séparation D" et passent par Pl" et P2" respectivement. Le système de restitution 1" comprend ainsi un réseau frontal de haut-parleurs comprenant les ensembles EAlm, EA2" et EA3" qui se situe dans un plan frontal par rapport aux positions d'écoute Pl" et P2", et un réseau arrière de haut-parleurs comprenant les ensembles EB1" et EB2" qui se situe dans un plan arrière par rapport aux positions d'écoute Pl" et P21".

La restitution du signal sonore S" est alors réalisée via le système 1" de la façon suivante : les canaux SL" et SR' sont utilisés pour générer des signaux d'alimentation des ensembles de haut-parleurs EA1" et EA2" respectivement, comme décrit précédemment dans le premier mode de réalisation, résultant en la création de deux sources virtuelles VA1" et VA2" ; le canal SC" est utilisé pour générer des signaux d'alimentation des haut-parleurs du troisième ensemble EA3" de haut-parleurs du sous-système A, en appliquant une technique de restitution spatiale directement sur ces canaux, comme décrit précédemment pour le signal d'entrée SC" dans le deuxième mode de réalisation ; les canaux SLs" et SRs" sont utilisés pour générer des signaux d'alimentation des ensembles de haut-parleurs EB1" et EB2" respectivement, comme décrit précédemment dans le premier mode de réalisation, résultant en la création de deux sources virtuelles VB1" et VB2m, comme illustré à la figure 10 ; et et le canal SLfe" est utilisé pour générer un signal d'alimentation d'un caisson de grave non représenté sur la figure 10. Il convient de noter que le sous-système « arrière » B peut être une réplique exacte du sous-système « avant » A, symétrique par rapport aux positions d'écoute P1" et P21". En variante, des configurations différentes de haut-parleurs peuvent être envisagées pour les deux sous-systèmes (ex. trois ensembles de deux haut-parleurs pour A et deux ensembles de deux haut-parleurs pour B, comme illustré sur la figure 10).

Claims

REVENDICATIONS1. Procédé de génération de signaux d'alimentation destinés à un système de restitution sonore (11;1"4") comprenant deux ensembles de haut-parleurs (E1',E2';E1",E2"; EA1",EA2m,EB11",EB2m) situés de part et d'autre d'un plan de séparation (D';D";D"), lesdits signaux d'alimentation étant générés en vue d'une restitution sonore d'un signal sonore multicanal (51;S";S") vers deux positions spatiales d'écoute (P1',P2';P1",P2";P1-,P2-), chaque position spatiale d'écoute étant associée à l'un des ensembles de haut-parleurs et étant située sur un plan parallèle (L1',L2';L1",L2";L1",L2'") au plan de séparation de sorte qu'au moins un haut-parleur de cet ensemble est positionné de part et d'autre de ce plan parallèle, le procédé de génération comprenant, pour chaque ensemble de haut-parleurs, une étape de génération (F20-F30,F50-F60), à partir d'un signal d'entrée dérivé du signal sonore multicanal pour cet ensemble, de signaux d'alimentation destinés à alimenter les haut-parleurs de cet ensemble, cette étape de génération comprenant l'application (F20,F50) d'une technique de restitution transaurale audit signal d'entrée, cette technique créant une source sonore virtuelle (V1',V2';V1",V2";VA1",VA2m,VB1m,VB2m) sur une première droite (d11',d22';d11",d22";d11"1,d22",d221",d11'") obtenue par symétrie, par rapport au plan parallèle (P1',P2';P1",P2";P1m,P2m) sur lequel est située la position spatiale d'écoute associée à cet ensemble, d'une seconde droite (d12',d21';d12",d21";d12",d21"1,d21",d12") reliant la position spatiale d'écoute au haut-parleur le plus distant de cette position appartenant à l'autre ensemble de haut-parleurs du système de restitution.
2. Procédé selon la revendication 1 dans lequel les haut-parleurs des deux ensembles de haut-parleurs sont sensiblement alignés sur un axe horizontal (A',4") du système de restitution.
3. Procédé selon la revendication 2 dans lequel au cours de l'étape de génération, la source virtuelle est créée à l'intersection de la première droite et de l'axe horizontal du système de restitution.
4. Procédé selon l'une quelconque des revendications 1 à 3, comprenant en outre une étape d'égalisation spectrale au cours de laquelle, on applique (F30,F60) individuellement à chaque signal d'alimentation destiné à alimenter un haut-parleur, un filtre d'égalisation adapté à ce haut-parleur.
5. Procédé selon la revendication 4 dans lequel chaque filtre d'égalisation adapté à un haut-parleur est choisi de sorte à obtenir un spectre d'amplitude d'une réponse fréquentielle établie pour ce haut-parleur à partir de mesures réalisées dans un environnement insonorisé, conforme à un premier spectre cible prédéterminé.
6. Procédé selon la revendication 4 ou 5 dans lequel les filtres d'égalisation sont choisis de sorte à obtenir un spectre d'amplitude moyen évalué à partir des réponses impulsionnelles des haut-parleurs des ensembles du système de restitution, conforme à un second spectre cible prédéterminé.
7. Procédé selon l'une quelconque des revendications 1 à 6 comprenant en outre une étape d'analyse spatiale (F10) du signal sonore multicanal comprenant l'extraction d'au moins un objet sonore et la détermination d'une position spatiale de cet objet sonore, chaque signal d'entrée utilisé pour générer les signaux d'alimentation des haut-parleurs d'un ensemble de haut-parleurs étant élaboré à partir d'au moins un objet sonore extrait lors de cette étape d'analyse spatiale et sélectionné en fonction de sa position spatiale par rapport au plan de séparation.
8. Procédé selon l'une quelconques des revendications 1 à 7 dans lequel le système de restitution comprend en outre un troisième ensemble (E3") de haut-parleurs, au moins un haut- parleur de ce troisième ensemble étant placé de part et d'autre du plan de séparation.
9. Procédé selon l'une quelconque des revendications 1 à 8 dans lequel chaque ensemble de haut-parleurs du système de restitution comprend une paire de haut-parleurs.
10. Programme comportant des instructions pour l'exécution des étapes du procédé de restitution selon l'une quelconque des revendications 1 à 9 lorsque ledit programme est exécuté par un ordinateur ou par un microprocesseur.
11. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé de génération selon l'une quelconque des revendications 1 à 9.
12. Dispositif de génération (2',2",2") de signaux d'alimentation destinés à un système (11;1"4") de restitution sonore comprenant deux ensembles de haut-parleurs situés de part et d'autre d'un plan de séparation, lesdits signaux d'alimentation étant générés en vue d'une restitution sonore d'un signal sonore multicanal vers deux positions spatiales d'écoute, chaque position spatiale d'écoute étant associée à l'un des ensembles de haut-parleurs et étant située sur un plan parallèle au plan de séparation de sorte qu'au moins un haut-parleur de cet ensemble est positionné de part et d'autre de ce plan parallèle, le dispositif de génération comprenant des moyens aptes à générer pour chaque ensemble de haut-parleurs, à partir d'un signal d'entrée dérivé du signal sonore multicanal pour cet ensemble, des signaux d'alimentation destinés à alimenter les haut-parleurs de cet ensemble, ces moyensétant aptes à appliquer une technique de restitution transaurale audit signal d'entrée, cette technique créant une source sonore virtuelle sur une première droite obtenue par symétrie, par rapport au plan parallèle sur lequel est située la position spatiale d'écoute associée à cet ensemble, d'une seconde droite reliant la position spatiale d'écoute au haut-parleur le plus distant de cette position appartenant à l'autre ensemble de haut-parleurs du système de restitution.
13. Système de restitution sonore (1';1";11") comprenant : au moins deux ensembles de haut-parleurs ; et un dispositif de génération (2';2";2") selon la revendication 12 de signaux d'alimentation destinés aux haut-parleurs desdits deux ensembles de haut-parleurs.
14. Système de restitution sonore (1") selon la revendication 13 comprenant au moins deux ensembles (EA1m,EA2m) situés dans un plan frontal par rapport aux positions d'écoute (P1m,P2m) et au moins deux ensembles (EB1"1,EB2m) situés dans un plan arrière par rapport aux positions d'écoute.