WO2006048537A1 - Dynamic sound system configuration - Google Patents

Dynamic sound system configuration Download PDF

Info

Publication number
WO2006048537A1
WO2006048537A1 PCT/FR2005/002699 FR2005002699W WO2006048537A1 WO 2006048537 A1 WO2006048537 A1 WO 2006048537A1 FR 2005002699 W FR2005002699 W FR 2005002699W WO 2006048537 A1 WO2006048537 A1 WO 2006048537A1
Authority
WO
WIPO (PCT)
Prior art keywords
person
sound signal
listening
sound
reproduction
Prior art date
Application number
PCT/FR2005/002699
Other languages
French (fr)
Inventor
Olivier Bernier
Olivier Perrault
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Publication of WO2006048537A1 publication Critical patent/WO2006048537A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Definitions

  • the present invention relates generally to the field of electro-acoustic and deals with the rendering of sound signals through a sound system consisting of a plurality of loudspeakers.
  • the invention relates more particularly to a method of configuring a sound system consisting of a plurality of loudspeakers intended to broadcast a sound signal within a listening room, in which there is at least one person likely to move.
  • some home theater systems more commonly known as “home theater”
  • MCACC system Multi-Channel Acoustic Calibration System
  • the principle of the MCACC system is first to evaluate the number and type of speakers connected to the home theater system, as well as the acoustic characteristics of the room in which they are installed, then calibrate the speakers accordingly to obtain the best possible sound quality for the user.
  • the calibration consists in determining the power of the sound signal to be sent to each of the speakers and at what precise moment to send it.
  • the user equipped with a microphone connected to the system, is placed at its listening position in the room. Sound signals are then broadcast from the different speakers and the calibration process then consists in determining the number and type of speakers connected, their distance from the listening position of the user, as well as their pressure levels. sound.
  • the system is provided to make all the necessary adjustments to optimize listening of the user at its listening position in the room and in particular, to ensure that all the sounds broadcast by the speakers reach it with the same volume.
  • this method of the prior art for automatically adjusting the parameters of the different speakers of a home theater system according to the listening position of the user in the room where the system is installed is intended to optimize the sound reproduction only in this unique place of the room, in other words the configuration of the speakers is fixed at the initial listening position of the user.
  • this method does not take into account the possible mobility of the user.
  • the preset speaker setting parameters during the configuration phase of the home theater system are not intended to be adapted to the possible movements of the listener in the room, changing the listening position.
  • the disposition of the listener with respect to the speakers is a strong constraint. The mobility of the listener thus causes an alteration of his listening quality.
  • the present invention aims to remedy these drawbacks by proposing a method of configuring a sound system for dynamically optimizing the sound reproduction in several listening locations according to the actual position of at least one person , taking into account to configure the system, moving people.
  • the invention moreover in conformity with the generic definition given in the preamble above, is essentially characterized in that it comprises the real-time location of the position of at least said person. in said listening location, and the dynamic adaptation of the reproduction of said sound signal on at least one previously localized enclosure, according to said position of the person.
  • the location of the position of a person in the listening place includes the permanent acquisition of images of the listening location by at least one camera and real-time analysis of said images in order to recognize the presence of said person to permanently locate his position in the listening place according to his position in the image .
  • the analysis of the images acquired consists in the application of image processing algorithms, making it possible to detect in real time a face in an image and to provide its position in the image.
  • the analysis of the images acquired comprises the detection of the orientation of the face with respect to the axis of the camera, the dynamic adaptation of the sound signal reproduction being furthermore performed according to said orientation.
  • the location of the position of the speakers in the listening location comprises the prior determination of the position and orientation of each speaker with respect to the position and the axis of the camera.
  • the dynamic adaptation of the reproduction of the sound signal on at least one loudspeaker consists in adapting the sound level reproduced by said loudspeaker and / or in adapting the frequency spectrum of the sound signal reproduced by said loudspeaker and / or correct the generation of a sound reproduction effect located in the space.
  • the method comprises the identification of the localized person, the dynamic adaptation of the restitution of the sound signal being made taking into account further preferences associated with the identified person.
  • the dynamic adaptation of the sound signal reproduction is performed by learning.
  • the invention also relates to a sound system consisting of a plurality of loudspeakers provided to restore a sound signal within a listening place for at least one person, characterized in that it comprises means process for carrying out the process according to the invention.
  • Figure 1 thus describes a sound system according to the present invention. It comprises a plurality of loudspeakers El to En, intended to restore a sound signal 50 in a listening room where the speakers are installed, for at least one person likely to move in the place of residence. 'listening.
  • the sound system also comprises processing means 60, for dynamically configuring the system and whose various functions will be described in more detail below.
  • processing means 60 for dynamically configuring the system and whose various functions will be described in more detail below.
  • an object of the invention is to allow an optimized reproduction of the sound signal by the various speakers in several places of the listening place according to the actual position of one or more people in the place of listening.
  • the optimized reproduction of the sound by the speakers according to the position of a person advantageously takes into account the successive positions of the person considered.
  • the processing means comprise means for locating in real time the position of the persons present in the listening place. These means of location have the role of determining and then follow in real time the successive positions of people in the listening place.
  • the locating means comprise a camera 10, whose field covers at best the listening place and which is intended to acquire in real time and permanently images of the listening place.
  • the camera is preferably fixed. It could also be mobile. The use of several cameras could also be considered.
  • the locating means then implement a real-time analysis function of the images acquired by the camera with a view to recognizing the presence of at least one person, thereby permanently locating its position in the location of listens according to its position in the image.
  • image processing algorithms known in themselves, to detect and follow in real time a face in an image, can be used for this purpose. In this way, through the implementation of such algorithms, the image analysis function will return the number of faces on the image and their position in the image.
  • the notion of depth in the image must be taken into account.
  • the notion of depth with respect to the camera is for example treated by measuring a distance usually fairly constant in a face, such as the gap between the eyes.
  • the processing means may be necessary during this step of image analysis, in the case for example where there are two cameras to be calibrated.
  • the position information determined by the image analysis function for each person recognized by the camera may consist of location indication information of the listening location in which respectively the people recognized by the camera.
  • the scene corresponding to the listening location filmed by the camera is pre-cut into several areas.
  • the function of analysis of the images acquired by the camera 10 further comprises the detection of the orientation of the faces with respect to the axis of the camera.
  • the dynamic adaptation of the reproduction of the sound signal may then be carried out taking into account, on the one hand, the actual position of the person considered in the listening place and, on the other hand, the orientation of the face of the nobody.
  • the processing means 60 also implement a function 40 for locating the position of the speakers in the listening area, comprising the prior determination of the position and orientation of each speaker with respect to the position and the axis. from the camera.
  • the location of the position of the speakers in the listening location is preferably performed during a configuration phase of the processing means.
  • a dynamic adaptation function 30 of the reproduction of the sound signal on one or more speakers can then be implemented.
  • the adaptation of the sound signal reproduction on at least one speaker can then consist in dynamically adapting the sound level restored by the speaker or speakers depending on the position of the person considered in the listening place.
  • the adaptation of the sound signal reproduction on at least one speaker may also consist in dynamically adapting the frequency spectrum of the sound signal reproduced by the speaker or speakers depending on the position of the person considered in the listening place.
  • the dynamic adaptation of the reproduction of the sound signal on at least one speaker may still consist in correcting the generation of a sound reproduction effect located in the space.
  • the function 30 When several people are present in the listening place, the function 30 also has the role of distributing in real time the sound signal on the different speakers according to the actual position of people, so as to avoid interference between them.
  • an example of embodiment could be the following.
  • the dynamic adaptation function of the sound signal restitution selects for each of these people according to their respective position, the pair of speakers the most close and, for each pair of speakers, equalizes the sound levels of each of the speakers according to the position of the person, so that each person always has a stereophonic listening sensation regardless of its position relative to the pair of speakers. selected speaker.
  • the dynamic adaptation function 30 of the processing means is therefore provided to control individually the different speakers El, ..., En of the sound system. Speaker direction can also be controlled by the adaptation function to avoid interference.
  • the function of dynamic adaptation of the reproduction of the sound signal is previously learned, either statistically, or by sampling and testing methods.
  • the embodiment by learning could for example consist in that a person, having a means of remote communication with the sound system processing means, addresses to the processing means, while moving in the place of listening, a ranking to indicate whether he is satisfied or not the quality of listening in different places of the place.
  • a specific neural network type algorithm for example, will then provide a model for optimizing the sound signals reproduced by the speakers as a function of the position of a person, so that in any place whatsoever, the restored signal is satisfactory. for this person.
  • An embodiment by sampling methods could typically be made as follows: a person is placed in different parts of the listening area equipped with a microphone and sound signals are then sent by the various speakers to allow to approach the more accurately a target signal.
  • the system keeps the possibility of being able to filter certain people to ensure that they can not benefit from the dynamic adaptation of the return of the sound signal.
  • filtering could be used depending on the position of the person, for example to avoid any adaptation when the person moves within the listening room in an area poorly covered by the speakers.
  • the processing means implement a function of identifying the localized person, the dynamic adaptation of the reproduction of the sound signal can be carried out taking into account also preferences associated with the identified person. It is then possible for example to amplify or reduce, respectively, a sound phenomenon, for example the sound volume of the sound signal restored for some identified persons, according to their preferences.
  • the identification of the persons may be performed by image processing algorithms based on face tracking, implemented by the image analysis function of the processing means.

Abstract

A method for configuring a sound system consisting of a plurality of loud speakers (E1, En) for reproducing a sound signal (50) in a listening space occupied by at least one person, characterised in that it includes a step of real-time location of the position of said person(s) in said listening space and a step of dynamic matching (30) of sound signal reproduction on at least one previously located speaker depending on said person's position.

Description

CONFIGURATION DYNAMIQUE D'UN SYSTEME SONORE DYNAMIC CONFIGURATION OF A SOUND SYSTEM
La présente invention concerne, de manière générale, le domaine de l'électro-acoustique et traite de la restitution de signaux sonores par l'intermédiaire d'un système sonore constitué d'une pluralité d'enceintes acoustiques.The present invention relates generally to the field of electro-acoustic and deals with the rendering of sound signals through a sound system consisting of a plurality of loudspeakers.
L'invention concerne plus particulièrement un procédé de configuration d'un système sonore constitué d'une pluralité d'enceintes acoustiques prévues pour diffuser un signal sonore au sein d'un lieu d'écoute, dans lequel se trouve au moins une personne susceptible de se déplacer. Dans l'état de la technique, certains systèmes de cinéma à la maison, plus communément appelé « home cinéma », comprennent des moyens de configuration de leur système sonore permettant de configurer automatiquement les enceintes en fonction de certaines spécificités de la pièce dans laquelle le système home cinéma est installé. La société Pioneer a développé un tel système, appelé système MCACC (« Multi-Channel Acoustic calibration System ») . Une description des caractéristiques principales de ce système est accessible sur l'Internet à l'adresse Web suivante : http://www.pioneerelectronics.com/pna/article/0, ,2076_4 151_20157532,00.html.The invention relates more particularly to a method of configuring a sound system consisting of a plurality of loudspeakers intended to broadcast a sound signal within a listening room, in which there is at least one person likely to move. In the state of the art, some home theater systems, more commonly known as "home theater", include means of configuring their sound system to automatically configure the speakers according to certain specificities of the room in which the home theater system is installed. Pioneer has developed such a system, called MCACC system ("Multi-Channel Acoustic Calibration System"). A description of the main features of this system is available on the Internet at the following Web address: http://www.pioneerelectronics.com/pna/article/0,, 2076_4 151_20157532,00.html.
Le principe du système MCACC est d'abord d'évaluer le nombre et le type d'enceintes connectées au système home cinéma, ainsi que les caractéristiques acoustiques de la pièce dans laquelle elles sont installées, puis de calibrer les enceintes en conséquence pour obtenir la meilleure qualité sonore possible pour l'utilisateur. Principalement, le calibrage consiste à déterminer la puissance du signal sonore à envoyer à chacune des enceintes et à quel moment précis 1'envoyer.The principle of the MCACC system is first to evaluate the number and type of speakers connected to the home theater system, as well as the acoustic characteristics of the room in which they are installed, then calibrate the speakers accordingly to obtain the best possible sound quality for the user. Primarily, the calibration consists in determining the power of the sound signal to be sent to each of the speakers and at what precise moment to send it.
Pour optimiser davantage la calibration des enceintes, l'utilisateur, équipé d'un microphone relié au système, se place au niveau de sa position d'écoute dans la pièce. Des signaux sonores sont alors diffusés par les différentes enceintes et le processus de calibration consiste alors à déterminer le nombre et le type d'enceintes connectées, leur distance par rapport à la position d'écoute de l'utilisateur, ainsi que leurs niveaux de pression sonore. En possession de ces informations, le système est prévu pour réaliser tous les ajustements nécessaires pour optimiser l'écoute de l'utilisateur au niveau de sa position d'écoute dans la pièce et notamment, pour faire en sorte que tous les sons diffusés par les enceintes l'atteignent avec un même volume.To further optimize the speaker calibration, the user, equipped with a microphone connected to the system, is placed at its listening position in the room. Sound signals are then broadcast from the different speakers and the calibration process then consists in determining the number and type of speakers connected, their distance from the listening position of the user, as well as their pressure levels. sound. In possession of this information, the system is provided to make all the necessary adjustments to optimize listening of the user at its listening position in the room and in particular, to ensure that all the sounds broadcast by the speakers reach it with the same volume.
Toutefois, ce procédé de l'art antérieur permettant de régler automatiquement les paramètres des différentes enceintes d'un système home cinéma en fonction de la position d'écoute de l'utilisateur dans la pièce où le système est installé, n'est prévu pour optimiser la restitution sonore qu'en ce lieu unique de la pièce, autrement dit la configuration des enceintes est figée à la position d'écoute initiale de l'utilisateur. Aussi, ce procédé ne tient pas compte de la mobilité éventuelle de l'utilisateur. Ainsi, les paramètres de réglage des enceintes prédéfinis lors de la phase de configuration du système home cinéma, ne sont pas prévus pour être adaptés aux déplacements éventuels de l'auditeur dans la pièce, modifiant la position d'écoute. Or, par rapport aux techniques de reproduction sonore, par exemple qui permettent de reproduire un son spatialisé, la disposition de l'auditeur par rapport aux enceintes est une contrainte forte. La mobilité de l'auditeur provoque donc une altération de sa qualité d'écoute.However, this method of the prior art for automatically adjusting the parameters of the different speakers of a home theater system according to the listening position of the user in the room where the system is installed, is intended to optimize the sound reproduction only in this unique place of the room, in other words the configuration of the speakers is fixed at the initial listening position of the user. Also, this method does not take into account the possible mobility of the user. Thus, the preset speaker setting parameters during the configuration phase of the home theater system, are not intended to be adapted to the possible movements of the listener in the room, changing the listening position. However, compared to sound reproduction techniques, for example that reproduce a spatialized sound, the disposition of the listener with respect to the speakers is a strong constraint. The mobility of the listener thus causes an alteration of his listening quality.
La présente invention a pour but de remédier à ces inconvénients en proposant un procédé de configuration d'un système sonore permettant d'optimiser de manière dynamique la restitution sonore en plusieurs lieux d'écoute en fonction de la position effective d'au moins une personne, en tenant compte pour configurer le système, des déplacements des personnes. Avec cet objectif en vue, l'invention, par ailleurs conforme à la définition générique qu'en donne le préambule ci-dessus, est essentiellement caractérisé en ce qu'il comprend la localisation en temps réel de la position d'au moins ladite personne dans ledit lieu d'écoute, et l'adaptation dynamique de la restitution dudit signal sonore sur au moins une enceinte préalablement localisée, en fonction de ladite position de la personne.The present invention aims to remedy these drawbacks by proposing a method of configuring a sound system for dynamically optimizing the sound reproduction in several listening locations according to the actual position of at least one person , taking into account to configure the system, moving people. With this objective in view, the invention, moreover in conformity with the generic definition given in the preamble above, is essentially characterized in that it comprises the real-time location of the position of at least said person. in said listening location, and the dynamic adaptation of the reproduction of said sound signal on at least one previously localized enclosure, according to said position of the person.
Selon un mode de réalisation préféré, la localisation de la position d'une personne dans le lieu d'écoute comprend l'acquisition permanente d'images du lieu d'écoute par au moins une caméra et l'analyse en temps réel desdites images en vue d'y reconnaître la présence de ladite personne pour localiser en permanence sa position dans le lieu d'écoute en fonction de sa position dans l'image.According to a preferred embodiment, the location of the position of a person in the listening place includes the permanent acquisition of images of the listening location by at least one camera and real-time analysis of said images in order to recognize the presence of said person to permanently locate his position in the listening place according to his position in the image .
Selon ce mode de réalisation, l'analyse des images acquises consiste en l'application d'algorithmes de traitement d'image, permettant de détecter en temps réel un visage dans une image et de fournir sa position dans l'image.According to this embodiment, the analysis of the images acquired consists in the application of image processing algorithms, making it possible to detect in real time a face in an image and to provide its position in the image.
Selon une variante, l'analyse des images acquises comprend la détection de l'orientation du visage par rapport à l'axe de la caméra, l'adaptation dynamique de la restitution du signal sonore étant en outre réalisée en fonction de ladite orientation.According to one variant, the analysis of the images acquired comprises the detection of the orientation of the face with respect to the axis of the camera, the dynamic adaptation of the sound signal reproduction being furthermore performed according to said orientation.
De préférence, la localisation de la position des enceintes dans le lieu d'écoute comprend la détermination préalable de la position et de l'orientation de chaque enceinte par rapport à la position et l'axe de la caméra.Preferably, the location of the position of the speakers in the listening location comprises the prior determination of the position and orientation of each speaker with respect to the position and the axis of the camera.
Dans un mode de réalisation, l'adaptation dynamique de la restitution du signal sonore sur au moins une enceinte consiste à adapter le niveau sonore restitué par ladite enceinte et/ou à adapter le spectre fréquentiel du signal sonore restitué par ladite enceinte et/ou à corriger la génération d'un effet de restitution sonore localisée dans l'espace.In one embodiment, the dynamic adaptation of the reproduction of the sound signal on at least one loudspeaker consists in adapting the sound level reproduced by said loudspeaker and / or in adapting the frequency spectrum of the sound signal reproduced by said loudspeaker and / or correct the generation of a sound reproduction effect located in the space.
Selon un mode de réalisation particulier, le procédé comprend l'identification de la personne localisée, l'adaptation dynamique de la restitution du signal sonore étant effectuée en tenant compte en outre de préférences associées à la personne identifiée.According to a particular embodiment, the method comprises the identification of the localized person, the dynamic adaptation of the restitution of the sound signal being made taking into account further preferences associated with the identified person.
Selon un autre mode de réalisation particulier, l'adaptation dynamique de la restitution du signal sonore est réalisée par apprentissage.According to another particular embodiment, the dynamic adaptation of the sound signal reproduction is performed by learning.
L'invention concerne encore un système sonore constitué d'une pluralité d'enceintes acoustiques prévues pour restituer un signal sonore au sein d'un lieu d'écoute à destination d'au moins une personne, caractérisé en ce qu'il comprend des moyens de traitement pour la mise en œuvre du procédé selon 1' invention.The invention also relates to a sound system consisting of a plurality of loudspeakers provided to restore a sound signal within a listening place for at least one person, characterized in that it comprises means process for carrying out the process according to the invention.
D'autres caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture de la description suivante donnée à titre d'exemple illustratif et non limitatif et faite en référence à la figure unique annexée, représentant schématiquement une architecture fonctionnelle d'un système sonore pour la mise en œuvre du procédé selon l'invention.Other features and advantages of the present invention will appear more clearly on reading the following description given by way of illustrative and nonlimiting example and with reference to the single appended figure, schematically showing a functional architecture of a sound system. for the implementation of the method according to the invention.
La figure 1 décrit donc un système sonore selon la présente invention. Il comprend une pluralité d'enceintes acoustiques El à En, prévues pour restituer un signal sonore 50 au sein d'un lieu d'écoute où les enceintes sont installées, à destination d'au moins une personne susceptible de se déplacer dans le lieu d'écoute.Figure 1 thus describes a sound system according to the present invention. It comprises a plurality of loudspeakers El to En, intended to restore a sound signal 50 in a listening room where the speakers are installed, for at least one person likely to move in the place of residence. 'listening.
Le système sonore comprend également des moyens de traitement 60, permettant de configurer dynamiquement le système et dont les différentes fonctions vont être décrites plus en détails ci-après. Comme il a déjà été exposé, un but de l'invention est de permettre une restitution optimisée du signal sonore par les différentes enceintes en plusieurs endroits du lieu d'écoute en fonction de la position effective de une ou plusieurs personnes dans le lieu d'écoute. La restitution optimisée du son par les enceintes en fonction de la position d'une personne tient avantageusement compte des positions successives de la personne considérée. Ainsi, les moyens de traitement comprennent des moyens de localisation en temps réel de la position des personnes présentes dans le lieu d'écoute. Ces moyens de localisation ont pour rôle de déterminer puis de suivre en temps réel les positions successives des personnes dans le lieu d'écoute.The sound system also comprises processing means 60, for dynamically configuring the system and whose various functions will be described in more detail below. As has already been explained, an object of the invention is to allow an optimized reproduction of the sound signal by the various speakers in several places of the listening place according to the actual position of one or more people in the place of listening. The optimized reproduction of the sound by the speakers according to the position of a person advantageously takes into account the successive positions of the person considered. Thus, the processing means comprise means for locating in real time the position of the persons present in the listening place. These means of location have the role of determining and then follow in real time the successive positions of people in the listening place.
Pour ce faire, selon un exemple de réalisation, les moyens de localisation comprennent une caméra 10, dont le champ recouvre au mieux le lieu d'écoute et qui est prévue pour acquérir en temps réel et en permanence des images du lieu d'écoute. La caméra est de préférence fixe. Elle pourrait également être mobile. L'utilisation de plusieurs caméras pourrait aussi être envisagée. les moyens de localisation mettent alors en œuvre une fonction d'analyse 20 en temps réel des images acquises par la caméra en vue d'y reconnaître la présence d'au moins une personne, pour ainsi localiser en permanence sa position dans le lieu d'écoute en fonction de sa position dans l'image. Selon un mode de réalisation préféré, des algorithmes de traitement d'image, connus en eux-mêmes, permettant de détecter et de suivre en temps réel un visage dans une image, peuvent être utilisées à cette fin. De cette manière, grâce à la mise en œuvre de tels algorithmes, la fonction d'analyse des images retournera le nombre de visages sur l'image et leur position dans l'image. Toutefois, pour pouvoir déterminer complètement la position précise de la personne dans le lieu d'écoute, la notion de profondeur dans l'image devra être prise en compte. La notion de profondeur par rapport à la caméra est par exemple traitée par la mesure d'une distance habituellement assez constante dans un visage, comme l'écart entre les yeux.To do this, according to an exemplary embodiment, the locating means comprise a camera 10, whose field covers at best the listening place and which is intended to acquire in real time and permanently images of the listening place. The camera is preferably fixed. It could also be mobile. The use of several cameras could also be considered. the locating means then implement a real-time analysis function of the images acquired by the camera with a view to recognizing the presence of at least one person, thereby permanently locating its position in the location of listens according to its position in the image. According to a preferred embodiment, image processing algorithms, known in themselves, to detect and follow in real time a face in an image, can be used for this purpose. In this way, through the implementation of such algorithms, the image analysis function will return the number of faces on the image and their position in the image. However, in order to be able to completely determine the precise position of the person in the listening place, the notion of depth in the image must be taken into account. The notion of depth with respect to the camera is for example treated by measuring a distance usually fairly constant in a face, such as the gap between the eyes.
La prise en compte de la localisation des caméras par les moyens de traitement peut s'avérer nécessaire lors de cette étape d'analyse d'images, dans le cas par exemple où il y a deux caméras devant être calibrées.Taking into account the location of the cameras by the processing means may be necessary during this step of image analysis, in the case for example where there are two cameras to be calibrated.
Dans un mode simplifié, les informations de position déterminées par la fonction d'analyse d'image 20 pour chaque personne reconnue par la caméra, peuvent consister en des informations d'indication de zones du lieu d'écoute dans lesquelles se trouvent respectivement la ou les personnes reconnues par la caméra. Selon ce mode, la scène correspondant au lieu d'écoute filmée par la caméra est pré-découpée en plusieurs zones.In a simplified mode, the position information determined by the image analysis function for each person recognized by the camera may consist of location indication information of the listening location in which respectively the people recognized by the camera. In this mode, the scene corresponding to the listening location filmed by the camera is pre-cut into several areas.
Selon un mode de réalisation plus complexe, la fonction 20 d'analyse des images acquises par la caméra 10 comprend en outre la détection de l'orientation des visages par rapport à l'axe de la caméra. L'adaptation dynamique de la restitution du signal sonore qui sera vue plus en détail ci-après, pourra alors être effectuée en tenant compte d'une part, de la position effective de la personne considérée au sein du lieu d'écoute et, d'autre part, de l'orientation du visage de la personne.According to a more complex embodiment, the function of analysis of the images acquired by the camera 10 further comprises the detection of the orientation of the faces with respect to the axis of the camera. The dynamic adaptation of the reproduction of the sound signal that will be view in more detail below, may then be carried out taking into account, on the one hand, the actual position of the person considered in the listening place and, on the other hand, the orientation of the face of the nobody.
Les moyens de traitement 60 mettent également en œuvre une fonction 40 de localisation de la position des enceintes dans le lieu d'écoute, comprenant la détermination préalable de la position et de l'orientation de chaque enceinte par rapport à la position et l'axe de la caméra. La localisation de la position des enceintes dans le lieu d'écoute est de préférence effectuée lors d'une phase de configuration des moyens de traitement. A partir des données de position des personnes fournies par la fonction d'analyse d'image 20, une fonction 30 d'adaptation dynamique de la restitution du signal sonore sur une ou plusieurs enceintes peut alors être mise en œuvre. L'adaptation de la restitution du signal sonore sur au moins une enceinte peut alors consister à adapter dynamiquement le niveau sonore restitué par la ou les enceintes en fonction de la position de la personne considérée dans le lieu d'écoute. L'adaptation de la restitution du signal sonore sur au moins une enceinte peut également consister à adapter dynamiquement le spectre fréquentiel du signal sonore restitué par la ou les enceintes en fonction de la position de la personne considérée dans le lieu d'écoute. Suivant le type d'application, l'adaptation dynamique de la restitution du signal sonore sur au moins une enceinte peut encore consister à corriger la génération d'un effet de restitution sonore localisée dans l'espace.The processing means 60 also implement a function 40 for locating the position of the speakers in the listening area, comprising the prior determination of the position and orientation of each speaker with respect to the position and the axis. from the camera. The location of the position of the speakers in the listening location is preferably performed during a configuration phase of the processing means. From the position data of the persons provided by the image analysis function 20, a dynamic adaptation function 30 of the reproduction of the sound signal on one or more speakers can then be implemented. The adaptation of the sound signal reproduction on at least one speaker can then consist in dynamically adapting the sound level restored by the speaker or speakers depending on the position of the person considered in the listening place. The adaptation of the sound signal reproduction on at least one speaker may also consist in dynamically adapting the frequency spectrum of the sound signal reproduced by the speaker or speakers depending on the position of the person considered in the listening place. Depending on the type of application, the dynamic adaptation of the reproduction of the sound signal on at least one speaker may still consist in correcting the generation of a sound reproduction effect located in the space.
Lorsque plusieurs personnes sont présentes dans le lieu d'écoute, la fonction 30 a également pour rôle de répartir en temps réel le signal sonore sur les différentes enceintes en fonction de la position effective des personnes, de manière à éviter les interférences entre elles.When several people are present in the listening place, the function 30 also has the role of distributing in real time the sound signal on the different speakers according to the actual position of people, so as to avoid interference between them.
Un exemple de réalisation pourrait être le suivant. Après que les moyens de localisation ont localisé deux personnes au sein du lieu d'écoute, la fonction d'adaptation dynamique de la restitution du signal sonore sélectionne pour chacune de ces personnes en fonction de leur position respective, la paire d'enceintes la plus proche et, pour chaque paire d'enceintes, égalise les niveaux sonores de chacune des enceintes en fonction de la position de la personne, de façon que chaque personne conserve toujours une sensation d'écoute stéréophonique quelque soit sa position par rapport à la paire d'enceintes sélectionnée. La fonction 30 d'adaptation dynamique des moyens de traitement est donc prévue pour piloter individuellement les différentes enceintes El, ..., En du système sonore. La direction des enceintes peut également être contrôlée par la fonction d'adaptation de manière à éviter les interférences. Selon un mode de réalisation simplifié à base d'apprentissage, la fonction d'adaptation dynamique de la restitution du signal sonore est préalablement apprise, soit statistiquement, soit par des méthodes d'échantillonnage et de test.An example of embodiment could be the following. After the locating means have located two people within the listening place, the dynamic adaptation function of the sound signal restitution selects for each of these people according to their respective position, the pair of speakers the most close and, for each pair of speakers, equalizes the sound levels of each of the speakers according to the position of the person, so that each person always has a stereophonic listening sensation regardless of its position relative to the pair of speakers. selected speaker. The dynamic adaptation function 30 of the processing means is therefore provided to control individually the different speakers El, ..., En of the sound system. Speaker direction can also be controlled by the adaptation function to avoid interference. According to a simplified embodiment based on learning, the function of dynamic adaptation of the reproduction of the sound signal is previously learned, either statistically, or by sampling and testing methods.
Le mode de réalisation par apprentissage pourrait par exemple consister en ce que une personne, disposant d'un moyen de communication à distance avec les moyens de traitement du système sonore, adresse à destination des moyens de traitement, tout en se déplaçant dans le lieu d'écoute, un classement permettant d'indiquer s'il est satisfait ou non de la qualité d'écoute en différents endroits du lieu. Un algorithme spécifique de type réseau de neurones par exemple fournira alors un modèle permettant d'optimiser les signaux sonores restitués par les enceintes en fonction de la position d'une personne, pour qu'en quelque lieu que ce soit, le signal restitué soit satisfaisant pour cette personne.The embodiment by learning could for example consist in that a person, having a means of remote communication with the sound system processing means, addresses to the processing means, while moving in the place of listening, a ranking to indicate whether he is satisfied or not the quality of listening in different places of the place. A specific neural network type algorithm, for example, will then provide a model for optimizing the sound signals reproduced by the speakers as a function of the position of a person, so that in any place whatsoever, the restored signal is satisfactory. for this person.
Un mode de réalisation par des méthodes d'échantillonnage pourrait être typiquement réalisé ainsi : une personne se place dans différentes parties du lieu d'écoute équipée d'un micro et des signaux sonores sont alors envoyés par les différentes enceintes pour permettre d'approcher le plus fidèlement possible un signal cible.An embodiment by sampling methods could typically be made as follows: a person is placed in different parts of the listening area equipped with a microphone and sound signals are then sent by the various speakers to allow to approach the more accurately a target signal.
Toutefois, le système se garde la possibilité de pouvoir filtrer certaines personnes pour faire en sorte qu'elles ne puissent pas bénéficier de l'adaptation dynamique de la restitution du signal sonore. Notamment, un tel filtrage pourrait être utilisé en fonction de la position de la personne, par exemple pour éviter toute adaptation lorsque la personne se déplace au sein du lieu d'écoute dans une zone mal couverte par les enceintes.However, the system keeps the possibility of being able to filter certain people to ensure that they can not benefit from the dynamic adaptation of the return of the sound signal. In particular, such filtering could be used depending on the position of the person, for example to avoid any adaptation when the person moves within the listening room in an area poorly covered by the speakers.
Selon un mode de réalisation particulier de l'invention, les moyens de traitement mettent en œuvre une fonction d'identification de la personne localisée, l'adaptation dynamique de la restitution du signal sonore pouvant être effectuée en tenant compte en outre de préférences associées à la personne identifiée. Il est alors possible par exemple d'amplifier, respectivement réduire, un phénomène sonore, par exemple le volume sonore du signal sonore restitué pour certaines personnes identifiées, selon leurs préférences. L'identification des personnes peut être réalisée par les algorithmes de traitement d'image basés sur le suivi de visages, mis en œuvre par la fonction d'analyse d'image 20 des moyens de traitement. According to a particular embodiment of the invention, the processing means implement a function of identifying the localized person, the dynamic adaptation of the reproduction of the sound signal can be carried out taking into account also preferences associated with the identified person. It is then possible for example to amplify or reduce, respectively, a sound phenomenon, for example the sound volume of the sound signal restored for some identified persons, according to their preferences. The identification of the persons may be performed by image processing algorithms based on face tracking, implemented by the image analysis function of the processing means.

Claims

REVENDICATIONS
1. Procédé de configuration d'un système sonore constitué d'une pluralité d'enceintes acoustiques (El, ...En) prévues pour restituer un signal sonore (50) au sein d'un lieu d'écoute à destination d'au moins une personne, comprenant la localisation (20) en temps réel de la position d'au moins ladite personne dans ledit lieu d'écoute, et l'adaptation dynamique (30) de la restitution dudit signal sonore sur au moins une enceinte préalablement localisée, en fonction de ladite position de la personne, ledit procédé étant caractérisé en ce que l'adaptation dynamique de la restitution du signal sonore est effectuée en tenant compte en outre de préférences associées à ladite personne, déterminées après identification de ladite personne.1. A method of configuring a sound system consisting of a plurality of loudspeakers (El, ... En) provided to restore a sound signal (50) in a listening location to least one person, including the location (20) in real time of the position of at least said person in said listening place, and the dynamic adaptation (30) of the reproduction of said sound signal on at least one previously located enclosure , according to said position of the person, said method being characterized in that the dynamic adaptation of the restitution of the sound signal is carried out taking into account further preferences associated with said person, determined after identification of said person.
2. Procédé selon la revendication 1, caractérisé en ce que la localisation de la position d'une personne dans le lieu d'écoute comprend l'acquisition permanente d'images du lieu d'écoute par au moins une caméra (10) et l'analyse (20) en temps réel desdites images en vue d'y reconnaître la présence de ladite personne pour localiser en permanence sa position dans le lieu d'écoute en fonction de sa position dans l'image.2. Method according to claim 1, characterized in that the location of the position of a person in the listening place includes the permanent acquisition of images of the listening location by at least one camera (10) and the analyzing (20) in real time said images to recognize the presence of said person to permanently locate its position in the listening location according to its position in the image.
3. Procédé selon la revendication 2, caractérisé en ce que l'analyse des images acquises consiste en l'application d'algorithmes de traitement d'image, permettant de détecter en temps réel un visage dans une image et de fournir sa position dans l'image.3. Method according to claim 2, characterized in that the analysis of the acquired images consists of the application of image processing algorithms, to detect in real time a face in an image and to provide its position in the image.
4. Procédé selon la revendication 3, caractérisé en ce que l'analyse des images acquises comprend la détection de l'orientation du visage par rapport à l'axe de la caméra, l'adaptation dynamique de la restitution du signal sonore étant en outre réalisée en fonction de ladite orientation.4. Method according to claim 3, characterized in that the analysis of the acquired images comprises the detection of the orientation of the face with respect to the axis of the camera, the dynamic adaptation of the restitution of the sound signal being furthermore performed according to said orientation.
5. Procédé selon la revendication 2, 3 ou 4, caractérisé en ce que la localisation (40) de la position des enceintes dans le lieu d'écoute comprend la détermination préalable de la position et de l'orientation de chaque enceinte par rapport à la position et l'axe de la caméra.5. Method according to claim 2, 3 or 4, characterized in that the location (40) of the position of the speakers in the listening location comprises the prior determination of the position and orientation of each speaker with respect to the position and axis of the camera.
6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que l'adaptation dynamique de la restitution du signal sonore sur au moins une enceinte consiste à adapter le niveau sonore restitué par ladite enceinte.6. Method according to any one of the preceding claims, characterized in that the dynamic adaptation of the sound signal reproduction on at least one chamber is to adapt the sound level restored by said enclosure.
7. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que l'adaptation dynamique de la restitution du signal sonore sur au moins une enceinte consiste à adapter le spectre fréquentiel du signal sonore restitué par ladite enceinte. 7. Method according to any one of the preceding claims, characterized in that the dynamic adaptation of the reproduction of the sound signal on at least one chamber is to adapt the frequency spectrum of the sound signal restored by said enclosure.
8. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que l'adaptation dynamique de la restitution du signal sonore sur au moins une enceinte consiste à corriger la génération d'un effet de restitution sonore localisée dans l'espace.8. Method according to any one of the preceding claims, characterized in that the dynamic adaptation of the reproduction of the sound signal on at least one speaker is to correct the generation of a localized sound reproduction effect in space.
9. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que l'adaptation dynamique de la restitution du signal sonore est réalisée par apprentissage.9. Method according to any one of the preceding claims, characterized in that the dynamic adaptation of the reproduction of the sound signal is performed by learning.
10. Système sonore constitué d'une pluralité d'enceintes acoustiques prévues pour restituer un signal sonore au sein d'un lieu d'écoute à destination d'au moins une personne, caractérisé en ce qu'il comprend des moyens de traitement (60) pour la mise en œuvre du procédé selon l'une quelconque des revendications 1 à 9. 10. Sound system consisting of a plurality of loudspeakers provided to restore a sound signal within a listening area for at least one person, characterized in that it comprises processing means (60 ) for carrying out the method according to any one of claims 1 to 9.
PCT/FR2005/002699 2004-11-03 2005-10-27 Dynamic sound system configuration WO2006048537A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0411709 2004-11-03
FR0411709A FR2877534A1 (en) 2004-11-03 2004-11-03 DYNAMIC CONFIGURATION OF A SOUND SYSTEM

Publications (1)

Publication Number Publication Date
WO2006048537A1 true WO2006048537A1 (en) 2006-05-11

Family

ID=34950763

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2005/002699 WO2006048537A1 (en) 2004-11-03 2005-10-27 Dynamic sound system configuration

Country Status (2)

Country Link
FR (1) FR2877534A1 (en)
WO (1) WO2006048537A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782045A (en) * 2020-06-30 2020-10-16 歌尔科技有限公司 Equipment angle adjusting method and device, intelligent sound box and storage medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009124772A1 (en) * 2008-04-09 2009-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating filter characteristics
FR3104734B1 (en) * 2019-12-17 2021-12-10 Sagemcom Broadband Sas Audio channel balancing method using UWB geolocation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4027338A1 (en) * 1990-08-29 1992-03-12 Drescher Ruediger Automatic balance control for stereo system - has sensors to determine position of person and adjusts loudspeaker levels accordingly
EP0578558A1 (en) * 1992-07-07 1994-01-12 Thomson-Csf Process for identifying objects in an image
WO2002041664A2 (en) * 2000-11-16 2002-05-23 Koninklijke Philips Electronics N.V. Automatically adjusting audio system
US6741273B1 (en) * 1999-08-04 2004-05-25 Mitsubishi Electric Research Laboratories Inc Video camera controlled surround sound

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4027338A1 (en) * 1990-08-29 1992-03-12 Drescher Ruediger Automatic balance control for stereo system - has sensors to determine position of person and adjusts loudspeaker levels accordingly
EP0578558A1 (en) * 1992-07-07 1994-01-12 Thomson-Csf Process for identifying objects in an image
US6741273B1 (en) * 1999-08-04 2004-05-25 Mitsubishi Electric Research Laboratories Inc Video camera controlled surround sound
WO2002041664A2 (en) * 2000-11-16 2002-05-23 Koninklijke Philips Electronics N.V. Automatically adjusting audio system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782045A (en) * 2020-06-30 2020-10-16 歌尔科技有限公司 Equipment angle adjusting method and device, intelligent sound box and storage medium

Also Published As

Publication number Publication date
FR2877534A1 (en) 2006-05-05

Similar Documents

Publication Publication Date Title
AU2016213897B2 (en) Adaptive room equalization using a speaker and a handheld listening device
EP1836876B1 (en) Method and device for individualizing hrtfs by modeling
EP1946612B1 (en) Hrtfs individualisation by a finite element modelling coupled with a corrective model
EP2898707B1 (en) Optimized calibration of a multi-loudspeaker sound restitution system
US11521591B2 (en) Apparatus and method for processing volumetric audio
WO2007137232A2 (en) Method of modifying audio content
US11558697B2 (en) Method to acquire preferred dynamic range function for speech enhancement
FR2996094A1 (en) METHOD AND SYSTEM FOR RECOVERING AN AUDIO SIGNAL
US8238589B2 (en) Objective quantification of auditory source width of a loudspeakers-room system
CN113196805A (en) Method for obtaining and reproducing a binaural recording
WO2006048537A1 (en) Dynamic sound system configuration
EP2009891B1 (en) Transmission of an audio signal in an immersive audio conference system
EP3815395B1 (en) Method for the spatial sound reproduction of a sound field which is selectively audible in a sub-area of an area
EP3149968B1 (en) Method for assisting with following a conversation for a hearing-impaired person
FR3065137A1 (en) SOUND SPATIALIZATION METHOD
Joubaud et al. Sound localization models as evaluation tools for tactical communication and protective systems
US20220342213A1 (en) Miscellaneous audio system applications
US11190896B1 (en) System and method of determining head-related transfer function parameter based on in-situ binaural recordings
EP3440847A1 (en) Method for reproducing sound, taking account of individual requirements
JP4198915B2 (en) Spatial sonic steering system
FR3052319A1 (en) MICRO / HELMET AUDIO COMBINATION COMPRISING MULTIPLE VOICE ACTIVITY DETECTING MEANS WITH SUPERVISING CLASSIFIER.
EP4297410A1 (en) Method for managing an audio stream using a camera and associated decoder equipment
EP2987339B1 (en) Method for acoustical reproduction of a numerical audio signal
FR3093264A1 (en) Method of broadcasting an audio signal
FR2851878A1 (en) Determining acoustic transfer function for person includes use of face and profile digital camera photos enabling automatic determination of functions

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KN KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 05815153

Country of ref document: EP

Kind code of ref document: A1