EP3449643B1 - Procédé et système de diffusion d'un signal audio à 360° - Google Patents
Procédé et système de diffusion d'un signal audio à 360° Download PDFInfo
- Publication number
- EP3449643B1 EP3449643B1 EP17725294.7A EP17725294A EP3449643B1 EP 3449643 B1 EP3449643 B1 EP 3449643B1 EP 17725294 A EP17725294 A EP 17725294A EP 3449643 B1 EP3449643 B1 EP 3449643B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- sound signal
- microphones
- ambisonic
- format
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 39
- 238000000034 method Methods 0.000 title claims description 27
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 8
- 230000001131 transforming effect Effects 0.000 claims 3
- 230000004044 response Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000007654 immersion Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
Definitions
- the present invention relates to the field of sound signal processing.
- 3D audio has been reserved for sound professionals and researchers.
- the purpose of this technology is to capture as much spatial information as possible during recording, then restore it to the listener and give them a feeling of immersion in the sound scene.
- the interest is growing for videos filmed at 360 ° and reproduced via a virtual reality headset for a complete immersion in the image: the user can turn his head and explore the visual scene all around from him.
- the most compact solution is the use of a network of microphones, such as for example the Eigenmike from mh acoustics, the Soundfield from TSL Products, and the TetraMic from Core Sound.
- the document WO 2005/015954 shows a method for converting the signals of an array of microphones placed in a spherical configuration into an ambisonic format. Equipped with four to thirty-two microphones, these products are expensive and therefore reserved for professional use. Recent research has reduced the number of microphones ( Palacino, JD, & Nicol, R. (2013). "Spatial sound pick-up with a low number of microphones.” ICA 2013. Montreal, Canada .), and microphones of reduced size and cost can be used such as those available in mobile phones.
- the shape of the microphone networks, a polyhedron remains standardized, however, from the dodecahedron for the EigenMike to the tetrahedron for the Soundfield and the TetraMic.
- the present invention intends to remedy the drawbacks of the prior art by proposing a method for processing the sound signal making it possible to capture the sound signal in all directions, then to restore said sound signal.
- the present invention relates, in its most general sense, to a method for processing the sound signal, according to claim 1.
- the matrix calculation involves a matrix H calculated by the method of least squares from the measured directivities of the N microphones and the ideal directivities of the ambisonic components.
- said microphones are arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a portable telephone.
- said method uses four microphones spaced at an angle of 90 ° to the horizontal.
- said method implements a filter bandpass filter from 100 Hz to 6 kHz.
- the order R of the ambisonic type format is equal to one.
- said information relating to the orientation of the head of a user listening to the sound signal is captured by a sensor in a mobile phone or by a sensor located in a headset or a virtual reality headset.
- the data in ambisonic format are transformed into data in binaural format.
- the present invention also relates to a sound signal processing system according to claim 9.
- the present invention relates to a method for processing the sound signal, according to claim 1.
- said microphones are arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a portable telephone.
- the method according to the present invention uses four microphones spaced at an angle of 90 ° to the horizontal.
- the order R of the ambisonic type format is equal to one.
- the first step of the method according to the present invention consists in recording the sound signal.
- N microphones are used, N being a natural integer greater than or equal to three, said microphones being arranged in a circle on a plane, spaced at an angle equal to 360 ° / N or at each corner of a mobile telephone.
- N is equal to four and the microphones are spaced 90 ° apart.
- These microphones are arranged in a circle on a plane.
- the radius of said circle is two centimeters, and the microphones are omnidirectional.
- the sound signal is picked up by said microphones and digitized. It is a synchronous capture.
- the second step of the method according to the present invention consists in encoding said four sampled digital signals, in an ambisonic type format of order R, R being a natural integer greater than or equal to one.
- the ambisonic format is a standardized format for audio coding in several dimensions.
- the order R is equal to one.
- This order 1 makes it possible to represent the sound with the following concepts: Front - Rear and Left - Right.
- the Figures 4a, 4b and 4c represent the ideal components W, Y and X of an order 1 ambisonic format (on a horizontal plane).
- the Figures 5a, 5b and 5c illustrate the approximate W, Y and X components of a first order ambisonic format.
- the Figure 2 illustrates the treatments applied in the context of the second step of the method according to the present invention.
- Hanning windows are used with an overlap by implementing a “ overlap-add” type function .
- This matrix includes weighting coefficients for each microphone signal and each frequency.
- the method according to the present invention implements a filter bandpass filter from 100 Hz to 6 kHz. This eliminates the lower part and the acute part.
- the impulse responses of the N microphones are measured, in the present case of the four microphones, with a source positioned every 5 ° or every 10 ° around the microphone array.
- the frequency responses of the N microphones are obtained as a function of the angles measured, or in other words the directivities of the N microphones as a function of the frequency.
- the microphones' responses are then placed in a matrix C.
- H NOT ⁇ V P D ⁇ V
- N the number of microphones (four in the present embodiment)
- D the number of angular source positions measured (108 in the present embodiment)
- V the number of ambisonic channels (three in the present example)
- C DxN denotes the directivities of the microphones
- H NxV denotes the matrix which transforms the directivities of the microphones into the desired directivities
- P DxV denotes the directivities prescribed by the ambisonic format (W, X and Y in the present example of production).
- H NxV P DxV / C DxN for each frequency index k if C DxN is invertible.
- C DxN is not invertible.
- a least squares method is implemented to solve for C 108x4 .
- H 4x3 P 108x3
- the matrix H is defined once for the future uses of the network of microphones considered. Then, with each use, a matrix multiplication is carried out in the frequency domain.
- Said matrix H has as many lines as there are microphones, therefore four in the present embodiment, and as many columns as required by the order of the ambisonic format used, therefore three columns in the present embodiment, in which the order 1 is implemented horizontally.
- Out In x H, where H denotes the previously calculated matrix, In denotes the input (audio channels coming from the network of microphones, passed in the frequency domain) and Out denotes the output (Out being reconverted in the temporal domain for get ambisonic format).
- the method according to the present invention implements, during this second step, an algorithm called least squares algorithm for each frequency, with for example 512 frequency points.
- data is obtained in the ambisonic format (in the present exemplary embodiment the signals W, X and Y).
- the third step of the method according to the present invention consists in restoring the sound signal, by means of a transformation of the data in ambisonic format into two binaural channels.
- the information relating to the orientation of the head of the user listening to the sound signal is collected and used. This can be realized by a sensor in a mobile phone, a headset or a virtual reality headset.
- This orientation information consists of a vector comprising three angle values, in Anglo-Saxon terminology “ pitch”,”yaw” and “ roll”.
- the angle value " yaw" is used on a plane.
- the ambisonic format is transformed into eight audio channels corresponding to a virtual placement of eight speakers, each placed at 45 ° around the user.
- the Figure 6 represents the placement of eight virtual speakers, each placed at 45 ° around a user.
- W, X and Y are the data relating to the ambisonic format
- ⁇ n represents the horizontal angle of the n th loudspeaker.
- W, X and Y are the data relating to the ambisonic format
- ⁇ n represents the horizontal angle of the n th loudspeaker.
- HRTF head-related transfer function
- IIR Infinite Impulse Response
- ⁇ n ⁇ n - ⁇ .
- the Figure 3 represents the different stages of the process according to the present invention.
- the present invention also relates to a sound signal processing system according to claim 9.
- This sound signal processing system includes at least one computing unit and one memory unit.
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
- La présente invention se rapporte au domaine du traitement du signal sonore.
- On connaît dans l'état de la technique des procédés et des systèmes permettant de diffuser des signaux vidéo à 360°. Il existe un besoin dans l'état de la technique de pouvoir associer des signaux audio à ces signaux vidéo à 360°.
- Jusqu'à maintenant, l'audio 3D était réservé aux professionnels du son et aux chercheurs. Cette technologie a pour objectif de capturer le maximum d'informations spatiales lors de l'enregistrement pour les restituer ensuite à l'auditeur et lui donner une sensation d'immersion dans la scène sonore. Dans le domaine de la vidéo, l'intérêt est croissant pour les vidéos filmées à 360° et reproduites via un casque de réalité virtuelle pour une immersion complète dans l'image : l'utilisateur peut tourner la tête et explorer la scène visuelle tout autour de lui. Pour obtenir la même fidélité dans le domaine du son, la solution la plus compacte est l'utilisation d'un réseau de microphones, comme par exemple l'Eigenmike de mh acoustics, le Soundfield de TSL Products, et le TetraMic de Core Sound. Le document
WO 2005/015954 montre un procédé pour convertir les signaux d'un réseau de microphones placés selon une configuration sphérique en un format ambisonique. Equipés de quatre à trente-deux microphones, ces produits sont onéreux et donc réservés à des utilisations professionnelles. De récentes recherches ont permis de réduire le nombre de microphones (Palacino, J. D., & Nicol, R. (2013). "Spatial sound pick-up with a low number of microphones." ICA 2013. Montréal, Canada.), et des microphones de taille et de coût réduits peuvent être utilisés tels que ceux dont disposent les téléphones portables. La forme des réseaux de microphones, un polyhèdre, reste cependant standardisée, du dodécaèdre pour l'EigenMike au tetrahèdre pour le Soundfield et le TetraMic. Cette forme géométrique permet d'utiliser des formules simples pour convertir les signaux des microphones en un format ambisonique, et ont été développées par Gerzon en 1975 (Gerzon, M. (1975). « The design of precisely coincident microphone arrays for stereo and surround sound. » 50th Audio Engineering Society Conference .). Le format ambisonique est un ensemble de canaux audio qui contient toutes les informations nécessaires à la reconstruction spatiale du champ sonore. Une nouveauté apportée par le présent brevet est la possibilité d'utiliser une forme quelconque de réseau de microphones. Ainsi, il est tout à fait possible d'utiliser une forme déjà existante, telle une caméra 360° ou un téléphone portable, pour y inclure un certain nombre de microphones. On obtient alors un système complet et compact d'enregistrement du son et de l'image à 360°. - La présente invention entend remédier aux inconvénients de l'art antérieur en proposant un procédé de traitement du signal sonore permettant de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
- A cet effet, la présente invention concerne, dans son acception la plus générale, un procédé de traitement du signal sonore, conformément à la revendication 1.
- Ainsi, grâce au procédé selon la présente invention, il est possible de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
- Avantageusement, le calcul matriciel fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
- Selon un mode de réalisation, lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable.
- Selon un mode de réalisation, ledit procédé met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
- Selon un mode de réalisation, ledit procédé met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz.
- Selon un mode de réalisation, l'ordre R du format de type ambisonique est égal à un.
- Avantageusement, au cours de ladite étape de restitution, une information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est exploitée.
- De préférence, une captation de ladite information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est réalisée par un capteur au sein d'un téléphone mobile ou bien par un capteur situé dans un casque d'écoute ou un casque de réalité virtuelle.
- Selon un mode de réalisation, au cours de ladite étape de restitution, les données sous format ambisonique sont transformées en données sous format binaural.
- La présente invention se rapporte également à un système de traitement du signal sonore, conformément à la revendication 9.
- On comprendra mieux l'invention à l'aide de la description, faite ci-après à titre purement explicatif, d'un mode de réalisation de l'invention, en référence aux Figures dans lesquelles :
- Les
Figures 1 et3 représentent les différentes étapes du procédé selon la présente invention ; - La
Figure 2 illustre les traitements appliqués dans le cadre de la seconde étape du procédé selon la présente invention ; - Les
Figures 4a, 4b et 4c représentent les composantes W, Y et X idéales d'un format ambisonique d'ordre 1 (sur plan horizontal) ; - Les
Figures 5a, 5b et 5c illustrent les composantes W, Y et X approximées d'un format ambisonique d'ordre 1 ; et - La
Figure 6 représente le placement de huit haut-parleurs virtuels, chacun placé à 45° autour d'un utilisateur. - La présente invention se rapporte à un procédé de traitement du signal sonore, conformément à la revendication 1.
- Les
Figures 1 et3 illustrent les différentes étapes du procédé selon la présente invention. - Dans un mode de réalisation, lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable.
- Dans un mode de réalisation, le procédé selon la présente invention met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
- Dans un mode de réalisation, l'ordre R du format de type ambisonique est égal à un.
- La première étape du procédé selon la présente invention consiste en l'enregistrement du signal sonore. On utilise pour cet enregistrement N microphones, N étant un entier naturel supérieur ou égal à trois, lesdits microphones étant disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N ou à chaque coin d'un téléphone portable. Dans l'exemple de réalisation décrit ci-après, N est égal à quatre et les microphones sont espacés de 90°. Ces microphones sont disposés selon un cercle sur un plan. Dans un exemple particulier de mise en œuvre, le rayon dudit cercle est de deux centimètres, et les microphones sont omnidirectionnels.
- Le signal sonore est capté par lesdits microphones, et numérisé. Il s'agit d'une captation synchrone.
- On obtient à l'issue de cette première étape quatre signaux numériques échantillonnés.
- La seconde étape du procédé selon la présente invention consiste en l'encodage desdits quatre signaux numériques échantillonnés, en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un.
- On rappelle ici que le format ambisonique est un format normalisé de codage audio en plusieurs dimensions.
- Dans l'exemple de réalisation décrit ci-après, l'ordre R est égal à un. Cet ordre 1 permet de représenter le son avec les notions suivantes : Avant - Arrière et Gauche - Droite.
- Les
Figures 4a, 4b et 4c représentent les composantes W, Y et X idéales d'un format ambisonique d'ordre 1 (sur plan horizontal). - Les
Figures 5a, 5b et 5c illustrent les composantes W, Y et X approximées d'un format ambisonique d'ordre 1. - La
Figure 2 illustre les traitements appliqués dans le cadre de la seconde étape du procédé selon la présente invention. - On observe sur la
Figure 2 que les données en entrée sont dans le domaine temporel, passent dans le domaine fréquentiel suite à une opération de transformée de Fourier rapide (FFT ou « Fast Fourier Transform » en terminologie anglo-saxonne), puis les données en sortie sont dans le domaine temporel suite à une opération de transformée de Fourier rapide inverse (IFFT ou « Inverse Fast Fourier Transform » en terminologie anglo-saxonne). - De préférence, on utilise des fenêtres de Hanning avec un recouvrement en mettant en œuvre une fonction de type « overlap-add ».
- On observe également sur la
Figure 2 que les données fréquentielles d'entrées sont modifiées à l'aide d'une multiplication matricielle. Cette matrice comporte des coefficients pondérateurs pour chaque signal de microphone et chaque fréquence. - On observe également sur la
Figure 2 qu'un filtrage au moyen d'un filtre passe-bande est réalisé sur les données avant la sortie. - Dans un mode de réalisation, le procédé selon la présente invention met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz. On élimine ainsi la partie basse et la partie aigüe.
- Afin de calculer les coefficients de la matrice de pondération, on mesure des réponses impulsionnelles des N microphones, dans le cas présent des quatre microphones, avec une source positionnée tous les 5° ou tous les 10° autour du réseau de microphones.
- A l'aide d'une transformée de Fourier rapide, on obtient les réponses en fréquence des N microphones en fonction des angles mesurés, ou autrement dit les directivités des N microphones en fonction de la fréquence.
- Il est possible d'utiliser à ce stade les principes du procédé décrit dans la demande internationale publiée sous le numéro
WO 2015/128160 « Procédé et système d'égalisation acoustique automatisé » pour égaliser les réponses en fréquence sur l'axe de chacun des microphones. Les mêmes filtres d'égalisation sont appliqués à tous les microphones et pour toutes les positions angulaires de source. - Les réponses des microphones sont ensuite placées dans une matrice C.
- Dans le domaine fréquentiel, pour chaque index de fréquence k, on a
- On a ainsi HNxV = PDxV / CDxN pour chaque index de fréquence k si CDxN est inversible.
- En pratique, CDxN n'est pas inversible. Dans un mode de réalisation, on met en œuvre une méthode des moindres carrés pour résoudre C108x4 . H4x3 = P108x3
- La matrice H est définie une fois pour les utilisations futures du réseau de microphones considéré. Ensuite, à chaque utilisation on réalise une multiplication matricielle dans le domaine fréquentiel.
- Ladite matrice H possède autant de lignes que de microphones donc quatre dans le présent exemple de réalisation, et autant de colonnes que le requiert l'ordre du format ambisonique utilisé, donc trois colonnes dans le présent exemple de réalisation dans lequel l'ordre 1 est mis en œuvre sur le plan horizontal.
- On a Out = In x H , où H désigne la matrice précédemment calculée, In désigne l'entrée (canaux audio provenant du réseau de microphones, passés dans le domaine fréquentiel) et Out désigne la sortie (Out étant reconverti dans le domaine temporel pour obtenir le format ambisonique).
- Le procédé selon la présente invention met en œuvre, au cours de cette seconde étape, un algorithme dit algorithme des moindres carrés pour chaque fréquence, avec par exemple 512 points de fréquence.
- A l'issue de cette seconde étape, on obtient des données sous le format ambisonique (dans le présent exemple de réalisation les signaux W, X et Y).
- La troisième étape du procédé selon la présente invention consiste en la restitution du signal sonore, grâce à une transformation des données sous format ambisonique en deux canaux binauraux.
- Au cours de cette troisième étape, l'information relative à l'orientation de la tête de l'utilisateur écoutant le signal sonore, est récupérée et exploitée. Ceci peut être réalisé par un capteur au sein d'un téléphone mobile, d'un casque d'écoute ou d'un casque de réalité virtuelle.
- Cette information sur l'orientation consiste en un vecteur comportant trois valeurs d'angles, en terminologie anglo-saxonne « pitch », « yaw » et « roll ».
- Dans le présent exemple de réalisation, sur un plan, on utilise la valeur d'angle « yaw ».
- On transforme le format ambisonique en huit canaux audio correspondant à un placement virtuel de huit haut-parleurs, chacun placé à 45° autour de l'utilisateur.
- La
Figure 6 représente le placement de huit haut-parleurs virtuels, chacun placé à 45° autour d'un utilisateur. - Chaque haut parleur virtuel restitue un signal audio issu des composantes ambisoniques selon la formule:
- Ensuite, on effectue une étape de filtrage avec une paire de HRTF par haut-parleur, HRTF signifiant « Head-related transfer fonction » en terminologie anglo-saxonne. On associe une paire de filtres HRTF (oreille gauche et oreille droite) à chaque haut-parleur virtuel, puis on additionne (tous les canaux « oreille gauche » et tous les canaux « oreille droite » ensemble), afin de former deux canaux de sortie.
- Des coefficients IIR (« Infinite Impulse Response ») sont mis en œuvre à ce stade, lesdits filtres HRTF étant modélisés sous formes de filtres IIR.
- Lorsque l'utilisateur tourne la tête, la position des haut-parleurs virtuels est modifiée. Par exemple pour une rotation de la tête d'un angle a, l'angle des haut-parleurs virtuels devient βn = θn-α. On remplace alors θn par (θn-α) dans la formule (1) pour calculer le signal restitué par le nième haut-parleur virtuel.
- Ainsi, grâce au procédé selon la présente invention, il est possible de réaliser une captation du signal sonore dans toutes les directions, puis de restituer ledit signal sonore.
- La
Figure 3 représente les différentes étapes du procédé selon la présente invention. - La présente invention se rapporte également à un système de traitement du signal sonore, conformément à la revendication 9.
- Ce système de traitement du signal sonore comprend au moins une unité de calcul et une unité de mémoire.
- L'invention est décrite dans ce qui précède à titre d'exemple. Il est entendu que l'homme du métier est à même de réaliser différentes variantes de l'invention sans pour autant sortir du cadre du brevet.
Claims (9)
- Procédé de traitement du signal sonore, comportant les étapes suivantes :• Captation de façon synchrone d'un signal sonore d'entrée (Sentrée) à l'aide de N microphones, N étant un entier naturel supérieur ou égal à trois;• Encodage dudit signal sonore d'entrée (Sentrée) en un format de données (D) de son, ledit encodage comportant une sous-étape de transformation dudit signal d'entrée en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un, ladite sous-étape de transformation en un format de type ambisonique étant mise en œuvre à l'aide d'une transformée de Fourier rapide, d'une multiplication matricielle, d'une transformée de Fourier rapide inverse et à l'aide d'un filtre passe-bande ; et• Restitution d'un signal sonore de sortie (Ssortie) à l'aide d'un traitement numérique desdites données (D) de son ;et caractérisé en ce que la multiplication matricielle fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
- Procédé de traitement du signal sonore selon la revendication 1, caractérisé en ce que lesdits microphones sont disposés selon un cercle sur un plan, espacés suivant un angle égal à 360°/N, ou à chaque coin d'un téléphone portable.
- Procédé de traitement du signal sonore selon la revendication 2, caractérisé en ce qu'il met en œuvre quatre microphones espacés suivant un angle de 90° à l'horizontal.
- Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'il met en œuvre un filtre passe bande filtrant de 100 Hz à 6 kHz.
- Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce que l'ordre R du format de type ambisonique est égal à un.
- Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'au cours de ladite étape de restitution, une information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est exploitée.
- Procédé de traitement du signal sonore selon la revendication 6, caractérisé en ce qu'une captation de ladite information relative à l'orientation de la tête d'un utilisateur écoutant le signal sonore, est réalisée par un capteur au sein d'un téléphone, d'un casque d'écoute ou d'un casque de réalité virtuelle.
- Procédé de traitement du signal sonore selon l'une des revendications précédentes, caractérisé en ce qu'au cours de ladite étape de restitution, les données sous format ambisonique sont transformées en données sous format binaural.
- Système de traitement du signal sonore, comportant des moyens pour :• Capter de façon synchrone un signal sonore d'entrée (Sentrée) à l'aide de N microphones, N étant un entier naturel supérieur ou égal à trois ;• Encoder ledit signal sonore d'entrée (Sentrée) en un format de données (D) de son, et des moyens pour transformer ledit signal d'entrée en un format de type ambisonique d'ordre R, R étant un entier naturel supérieur ou égal à un, lesdits moyens pour transformer en un format de type ambisonique étant mis en œuvre à l'aide d'une transformée de Fourier rapide, d'une multiplication matricielle, d'une transformée de Fourier rapide inverse et à l'aide d'un filtre passe-bande ; et• Restituer un signal sonore de sortie (Ssortie) à l'aide d'un traitement numérique desdites données (D) de son ;et caractérisé en ce que la multiplication matricielle fait intervenir une matrice H calculée par la méthode des moindres carrés à partir des directivités mesurées des N microphones et des directivités idéales des composantes ambisoniques.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1653684A FR3050601B1 (fr) | 2016-04-26 | 2016-04-26 | Procede et systeme de diffusion d'un signal audio a 360° |
PCT/FR2017/050935 WO2017187053A1 (fr) | 2016-04-26 | 2017-04-20 | Procédé et système de diffusion d'un signal audio à 360° |
Publications (2)
Publication Number | Publication Date |
---|---|
EP3449643A1 EP3449643A1 (fr) | 2019-03-06 |
EP3449643B1 true EP3449643B1 (fr) | 2020-06-10 |
Family
ID=56943619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP17725294.7A Active EP3449643B1 (fr) | 2016-04-26 | 2017-04-20 | Procédé et système de diffusion d'un signal audio à 360° |
Country Status (5)
Country | Link |
---|---|
US (1) | US10659902B2 (fr) |
EP (1) | EP3449643B1 (fr) |
CN (1) | CN109661824A (fr) |
FR (1) | FR3050601B1 (fr) |
WO (1) | WO2017187053A1 (fr) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPO099696A0 (en) * | 1996-07-12 | 1996-08-08 | Lake Dsp Pty Limited | Methods and apparatus for processing spatialised audio |
US6021206A (en) * | 1996-10-02 | 2000-02-01 | Lake Dsp Pty Ltd | Methods and apparatus for processing spatialised audio |
NZ502603A (en) * | 2000-02-02 | 2002-09-27 | Ind Res Ltd | Multitransducer microphone arrays with signal processing for high resolution sound field recording |
FR2858512A1 (fr) * | 2003-07-30 | 2005-02-04 | France Telecom | Procede et dispositif de traitement de donnees sonores en contexte ambiophonique |
GB0906269D0 (en) * | 2009-04-09 | 2009-05-20 | Ntnu Technology Transfer As | Optimal modal beamformer for sensor arrays |
US9986356B2 (en) * | 2012-02-15 | 2018-05-29 | Harman International Industries, Incorporated | Audio surround processing system |
US9913064B2 (en) * | 2013-02-07 | 2018-03-06 | Qualcomm Incorporated | Mapping virtual speakers to physical speakers |
US9685163B2 (en) * | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
CN104424953B (zh) * | 2013-09-11 | 2019-11-01 | 华为技术有限公司 | 语音信号处理方法与装置 |
FR3018015B1 (fr) | 2014-02-25 | 2016-04-29 | Arkamys | Procede et systeme d'egalisation acoustique automatise |
-
2016
- 2016-04-26 FR FR1653684A patent/FR3050601B1/fr not_active Expired - Fee Related
-
2017
- 2017-04-20 EP EP17725294.7A patent/EP3449643B1/fr active Active
- 2017-04-20 WO PCT/FR2017/050935 patent/WO2017187053A1/fr active Application Filing
- 2017-04-20 CN CN201780034334.2A patent/CN109661824A/zh active Pending
- 2017-04-20 US US16/096,339 patent/US10659902B2/en active Active
Non-Patent Citations (1)
Title |
---|
None * |
Also Published As
Publication number | Publication date |
---|---|
WO2017187053A1 (fr) | 2017-11-02 |
FR3050601A1 (fr) | 2017-10-27 |
US20190132695A1 (en) | 2019-05-02 |
EP3449643A1 (fr) | 2019-03-06 |
CN109661824A (zh) | 2019-04-19 |
FR3050601B1 (fr) | 2018-06-22 |
US10659902B2 (en) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1836876B1 (fr) | Procédé et dispositif d'individualisation de hrtfs par modélisation | |
EP1563485B1 (fr) | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede | |
EP1946612B1 (fr) | Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif | |
EP2000002B1 (fr) | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme | |
EP1992198B1 (fr) | Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal | |
EP2898707B1 (fr) | Calibration optimisee d'un systeme de restitution sonore multi haut-parleurs | |
CN104581610B (zh) | 一种虚拟立体声合成方法及装置 | |
EP1586220B1 (fr) | Procede et dispositif de pilotage d'un ensemble de restitution a partir d'un signal multicanal | |
EP1999998A1 (fr) | Procede de synthese binaurale prenant en compte un effet de salle | |
EP2009891B1 (fr) | Transmission de signal audio dans un système de conférence audio immersive | |
EP2995095B1 (fr) | Appareil et procédé de compression d'un ensemble de réponses impulsionnelles spatiales binaurales à n canaux | |
EP3025514B1 (fr) | Spatialisation sonore avec effet de salle | |
EP3449643B1 (fr) | Procédé et système de diffusion d'un signal audio à 360° | |
FR3065137A1 (fr) | Procede de spatialisation sonore | |
WO2021212287A1 (fr) | Procédé de traitement de signal audio, dispositif de traitement audio et appareil d'enregistrement | |
EP3384688B1 (fr) | Décompositions successives de filtres audio | |
EP2987339B1 (fr) | Procédé de restitution sonore d'un signal numérique audio | |
WO2019020437A1 (fr) | Procédé et système de traitement d'un signal audio incluant un encodage au format ambisonique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: UNKNOWN |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE |
|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE |
|
17P | Request for examination filed |
Effective date: 20181113 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
AX | Request for extension of the european patent |
Extension state: BA ME |
|
DAV | Request for validation of the european patent (deleted) | ||
DAX | Request for extension of the european patent (deleted) | ||
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: GRANT OF PATENT IS INTENDED |
|
INTG | Intention to grant announced |
Effective date: 20191126 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE PATENT HAS BEEN GRANTED |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP Ref country code: AT Ref legal event code: REF Ref document number: 1280121 Country of ref document: AT Kind code of ref document: T Effective date: 20200615 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R096 Ref document number: 602017018008 Country of ref document: DE |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: FRENCH |
|
REG | Reference to a national code |
Ref country code: LT Ref legal event code: MG4D |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: NO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200910 Ref country code: LT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
REG | Reference to a national code |
Ref country code: NL Ref legal event code: MP Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: RS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: LV Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: HR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: BG Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200910 |
|
REG | Reference to a national code |
Ref country code: AT Ref legal event code: MK05 Ref document number: 1280121 Country of ref document: AT Kind code of ref document: T Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: AL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20201012 Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: CZ Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: IT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: RO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: EE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: SM Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: AT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: PL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: SK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20201010 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R097 Ref document number: 602017018008 Country of ref document: DE |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
26N | No opposition filed |
Effective date: 20210311 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MC Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20210420 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210420 |
|
REG | Reference to a national code |
Ref country code: BE Ref legal event code: MM Effective date: 20210430 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210420 Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210430 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210430 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210420 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20201010 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20210430 |
|
P01 | Opt-out of the competence of the unified patent court (upc) registered |
Effective date: 20230512 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: HU Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO Effective date: 20170420 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20240429 Year of fee payment: 8 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20240426 Year of fee payment: 8 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: MT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20200610 |